텍스트 마스킹 도구

주민등록번호, 전화번호, 이메일, 계좌번호, 성명 등 본문 텍스트 내 포함된 민감한 개인정보를 규격 패턴 정규식으로 감지하여 안전하게 마스킹 기호(*)로 일괄 치환 정제해 줍니다.

카테고리: 텍스트 도구

언제 사용하나요?

인적 정보가 포함된 고객 문의 본문이나 상담 기록을 사내 공유망에 기재해야 할 때, 유튜브 교육 영상 화면에 띄울 캡처 문서에서 기밀 식별자를 숨겨야 할 때, 혹은 데이터베이스 백업 시 개인정보보호법에 준하는 비식별 안전 전처리를 간편하고 빠르게 해결하고자 할 때 필수적입니다.

사용 방법

  • 개인 민감 데이터가 삽입된 원본 문장을 복사하여 텍스트 상자에 넣습니다.
  • 마스킹 보호를 씌우고 싶은 대상 정보(성명, 주민번호, 모바일폰, 이메일 등) 토글을 켭니다.
  • 실시간으로 기호 가공이 완료된 비식별화 아웃풋 결과를 안심하고 복사해 갑니다.

입력값 안내

한국인 성명 구조, 하이픈이 섞인 번호, 골뱅이(@)가 포함된 표준 이메일 형식 등 비정형 텍스트를 자유롭게 수용합니다.

계산·변환 기준

정보 유형별로 정밀 튜닝된 전용 정규표현식(Regex)을 가동합니다. 예컨대 한국 모바일 전화번호의 경우 `/^(\d{3})-(\d{3,4})-(\d{4})$/` 패턴을 통해 국번 부분 문자를 별표(`*`)로 리플레이스 교체하며, 주민번호 뒷자리는 `\d{7}` 패턴을 감지해 첫 성별 숫자를 뺀 나머지 자리를 `******`로 일괄 치환 정비합니다.

사용 예시

  • 고객 지원 데이터 아웃소싱 정제 - 외부 분석 솔루션이나 대행업체에 업무용 텍스트를 넘기기 전 연락처 유출 위험을 원천 봉쇄합니다.
  • 공공 게시판 회계 지출 증빙 게시 - 투명한 예산 집행 표 작성 시 첨부될 인물들의 실명과 계좌번호 중간 부분을 마스킹하여 사생활을 보호합니다.
  • 마케팅 이벤트 당첨자 게시판 공지 - 회원 이름이나 연락처를 부분 마스킹(`이*신, 010-***-1234`)해 동명이인 구별은 살리고 정보 누출은 방지합니다.

예시

  • 홍길동 입력 → 홍*동 (성명 가운데 자 블라인드)
  • 010-1234-5678 입력 → 010-****-5678 (전화번호 국번 가림)
  • sample@naver.com 입력 → sa***@naver.com (메일 식별 주소 중간 보호)

주의사항

  • 정규식 기반 마스킹은 통상적인 표준 기입 포맷을 기준으로 작동하므로, 사용자가 텍스트 중간에 교묘하게 오타성 공백이나 한글 독음(예: '영 일 영 - 일 이...')을 섞어 기재한 오염 데이터는 감지를 비껴갈 수 있으므로 최종 배포 전 육안 검수를 가산하시기 바랍니다.

계산·사용 가이드

개인정보보호법에 부합하는 정량 텍스트 비식별화 처리

수집된 텍스트 중 성명, 전화번호, 주민등록번호 등 특정 개인을 명확히 식별할 수 있는 핵심 속성들은 유출 시 법적 제재를 받습니다. 해당 단어 구간을 인지하기 쉬운 별표(*) 기호 등으로 덮어 씌우는 마스킹 작업은 정보 유출 대비 필수 관문입니다.

정규식 패턴 매칭 오류(오필터링) 방지를 위한 육안 검수 팁

개인정보 감지 알고리즘은 정형화된 형태소 및 숫자 서식을 스캔하므로, 주소가 줄바꿈이나 이중 띄어쓰기로 오염되어 적힌 변칙적인 텍스트는 간혹 탐지 망을 벗어날 우려가 있어 치환 결과를 최종 대조하는 보수적 태도가 권장됩니다.

자주 묻는 질문

마스킹 기호로 별표(*) 대신 다른 문자도 쓸 수 있나요?

예. 설정 옵션에서 샵(#), 대시(-), 혹은 완전 공백 빈칸을 선택할 수 있어 문서 서식 양식 규정에 알맞게 마스킹 질감을 조정할 수 있습니다.

이메일의 도메인 주소(예: @naver.com)도 가려지나요?

개인 식별 안전성에 가장 직접적인 영향을 끼치는 골뱅이 앞부분 사용자 아이디 위주로 마스킹하며, 도메인은 메일 서비스 대조 확인을 위해 원본 형태를 살려주는 균형 잡힌 알고리즘을 취합니다.

관련 도구

  • 텍스트 추출기 - 혼잡한 텍스트 본문 원문 속에서 정규식 필터 매칭을 통해 이메일 주소, 전화번호, 웹사이트 URL 주소, 숫자, 영단어, 혹은 한글 단어 등 원하는 핵심 정보 조각들만 실시간으로 발췌하여 한 줄씩 깔끔하게 나열해 줍니다.
  • 금칙어 검사기 - 본문 텍스트 내에 비속어, 음란 표현, 광고 키워드, 사내 민감 정보 등 유해 단어들이 포함되어 있는지 실시간으로 검사하고 필터링해 줍니다.
  • Regex 치환 테스트 - 정규식 패턴과 replacement 값을 적용해 치환 결과를 확인합니다.
  • 글자 수 계산기 - 입력된 문자열의 공백 포함 및 공백 제외 글자 수를 실시간으로 계산하며 단어 수와 줄 수, 문단 수를 분석합니다.
  • 바이트 계산기 - 입력된 문자열의 바이트 크기를 다양한 인코딩 방식(UTF-8, EUC-KR, UTF-16)에 맞춤 선택하여 실시간으로 계산해 줍니다.
  • 대소문자 변환기 - 영문 텍스트를 대문자, 소문자, 단어 첫 글자 대문자(Title Case), 문장 첫 글자 대문자(Sentence Case) 등으로 한 번에 일괄 변환해 줍니다.