금칙어 검사기
본문 텍스트 내에 비속어, 음란 표현, 광고 키워드, 사내 민감 정보 등 유해 단어들이 포함되어 있는지 실시간으로 검사하고 필터링해 줍니다.
카테고리: 텍스트 도구
언제 사용하나요?
인터넷 웹사이트 게시판의 유저 댓글 필터링, 검색 노출 제재를 방지하기 위한 블로그 광고성 어뷰징 키워드 자가 스캔, 기밀 보도자료 배포 전 회사 보안 단어 유출 방지 등 깨끗하고 안전한 가이드라인 텍스트를 유지하고자 할 때 유용합니다.
사용 방법
- 스캔할 본문 글 내용을 입력란에 붙여넣습니다.
- 탐지 대상이 될 금칙어 단어 목록을 쉼표나 줄바꿈으로 사전 영역에 기재합니다.
- 금칙어 체크를 통해 발견된 단어 개수 분석 및 대체 기호(*)로 세척 완료된 문장을 가져갑니다.
입력값 안내
검사할 메인 글 텍스트와 대조용 사용자 정의 금칙어 사전 문자열을 함께 입력받아 분석합니다.
계산·변환 기준
커스텀 사전에 명시된 단어들로 정밀 정규식을 동적 빌드합니다. 단어와 단어 사이에 교묘하게 삽입된 노이즈 기호(예: 특수문자, 마침표) 우회 수법도 매칭할 수 있도록 단어 철자 사이의 와일드카드 매칭 규칙을 적용하고, 발견된 키워드 구간을 마스킹 문자열로 치환 리플레이스합니다.
사용 예시
- 게시판 댓글 유해 욕설 사전 통제 - 클라이언트 사이드에서 악성 댓글에 들어갈 유해 비속어를 등록 전 차단하여 클린 커뮤니티를 유도합니다.
- 블로그 유사문서 키워드 페널티 점검 - 포털 로봇이 싫어하는 과도한 중복 마케팅 키워드 유입을 체크 필터하여 블로그 저품질 위험을 피합니다.
- 사외 발송 서류 비밀 유출 모니터링 - 외부 발송용 이메일이나 PDF 설명서에 사내 기밀 등급 프로젝트 보안 키워드가 실려 있는지 점검합니다.
예시
- 금지어 '욕설' 지정 후 '이건 욕설이다' 입력 → '이건 **이다' 로 교체 가공 (1건 탐지)
주의사항
- 너무 대중적인 범용 단어(예: '사람')를 금칙어로 묶을 경우, 일반적인 정상 설명문 속의 문장(예: '사람이 많다')까지 무차별로 훼손당하는 '오버 마스킹'이 생길 수 있으니 타깃 금칙어의 명확성을 기해야 합니다.
계산·사용 가이드
지능형 필터 우회 시도(띄어쓰기, 문장기호 혼입) 차단 기법
유해 비속어를 등록하는 사용자는 단어 사이에 점을 찍거나(`비.속.어`) 빈칸을 삽입해 감지 엔진을 피하려 합니다. 금칙어 철자 사이에 임의의 노이즈 기호 유입을 허용하는 동적 정규식 패턴을 빌드하면 변칙 우회 행위도 완벽 포괄 스캔합니다.
과도한 광역 금칙어 필터링(Over-filtering) 방지 및 사전 설계
예컨대 특정 비속어를 막기 위해 너무 흔하게 쓰이는 음절 자구 자체를 차단하면, 정상 대화(예: '바보처럼 굴지 마'의 '바보')에서 가치 있는 일반 문장까지 전부 마스킹 훼손을 입게 되므로, 금칙어 목록의 구성 시 정교한 정밀 단어 위주 바인딩이 요망됩니다.
자주 묻는 질문
단어 사이에 띄어쓰기나 점을 찍어 우회한 것도 잡을 수 있나요?
예. 문자열 우회 스캔 옵션을 탑재하여 단어 사이에 삽입된 스페이스나 점(`.`), 대시(`-`) 등의 특수기호를 지능적으로 스킵하고 알맹이 자모 조합만을 추적해 탐지하는 똑똑한 필터링을 지원합니다.
기본 제공되는 욕설 데이터베이스가 있나요?
예. 한국어 웹 환경에서 흔하게 쓰이는 기본 욕설 및 스팸 키워드 데이터를 백업 탑재하여, 별도 세팅을 안 해도 즉각 간편 검사 작동이 가능합니다.
관련 도구
- 텍스트 하이라이터 - 장문의 텍스트 본문에서 찾고자 하는 다수의 검색 키워드들을 실시간 탐색하여, 다양한 색상의 형광펜 효과로 입체 강조 표시해 줍니다.
- 텍스트 마스킹 도구 - 주민등록번호, 전화번호, 이메일, 계좌번호, 성명 등 본문 텍스트 내 포함된 민감한 개인정보를 규격 패턴 정규식으로 감지하여 안전하게 마스킹 기호(*)로 일괄 치환 정제해 줍니다.
- 줄 필터링 도구 - 대량의 텍스트 줄 목록에서 특정 핵심 단어를 포함하고 있는 줄만 똑똑하게 추출하거나, 반대로 해당 단어가 삽입된 줄을 리스트에서 일괄 제외하고 정돈해 줍니다.
- 글자 수 계산기 - 입력된 문자열의 공백 포함 및 공백 제외 글자 수를 실시간으로 계산하며 단어 수와 줄 수, 문단 수를 분석합니다.
- 바이트 계산기 - 입력된 문자열의 바이트 크기를 다양한 인코딩 방식(UTF-8, EUC-KR, UTF-16)에 맞춤 선택하여 실시간으로 계산해 줍니다.
- 대소문자 변환기 - 영문 텍스트를 대문자, 소문자, 단어 첫 글자 대문자(Title Case), 문장 첫 글자 대문자(Sentence Case) 등으로 한 번에 일괄 변환해 줍니다.