줄 필터링 도구

대량의 텍스트 줄 목록에서 특정 핵심 단어를 포함하고 있는 줄만 똑똑하게 추출하거나, 반대로 해당 단어가 삽입된 줄을 리스트에서 일괄 제외하고 정돈해 줍니다.

카테고리: 텍스트 도구

언제 사용하나요?

서버에서 내려받은 수만 줄의 접속/장애 로그 텍스트 파일 중 '500 ERROR'나 'CRITICAL' 키워드가 들어간 행만 긴급 속독 분석하고 싶을 때, 혹은 메일 명단 중 스팸성 도메인(예: '@test.com')이 들어간 줄만 전체 제외하고 가용 주소만 깔끔하게 정제하고 싶을 때 활용됩니다.

사용 방법

  • 필터링을 수행할 원본 줄글 텍스트를 입력창에 붙여넣습니다.
  • 필터링 기준으로 사용할 단어 키워드를 쓰고, '포함하는 줄만 추출' 또는 '포함하는 줄 제외' 모드를 고릅니다.
  • 정교하게 정제 필터링이 완료된 출력 리스트 데이터를 검수하고 복사해 갑니다.

입력값 안내

줄 단위로 데이터를 분리하여 대조하므로 엔터로 구분된 원본 텍스트와 매칭용 검색어를 기입합니다.

계산·변환 기준

텍스트를 `/\r?\n/` 규칙으로 split하여 각 행별 문자열 배열을 확보합니다. 그 후 자바스크립트의 `String.prototype.includes` 또는 정규식 매치 함수를 돌려 지정한 키워드가 행 문자열 내에 위치하는지 참/거짓 판단을 수행하고, 필터 조건(추출/제외) 만족 여부에 따라 결과 배열에 복량 가산하여 병합합니다.

사용 예시

  • 시스템 에러 로그 추적 - 거대한 콘솔 로그 덤프 파일 내에서 특정 컴포넌트명 또는 에러 레벨 코드를 스캔해 디버깅 포인트를 선점합니다.
  • 특정 도메인 메일 주소 정리 - 수집된 연락처 목록 데이터 중에서 유효하지 않은 임시 메일이나 퇴사자 도메인 행을 일괄 거부 제외합니다.
  • 텍스트 원고 속 주석 줄 제거 - 샵(#)이나 슬래시(//) 기호로 시작하는 문서 내 주석 라인들을 제외 키워드로 기입해 본문 단락만 깔끔히 남깁니다.

예시

  • 성공\n에러발생\n성공 입력 (키워드: 에러, 포함 추출) → 에러발생 만 도출
  • 관리자A\n일반B\n관리자C 입력 (키워드: 관리자, 제외) → 일반B 만 정제 출력

주의사항

  • 검색어로 너무 짧은 영문 한두 자(예: 'a')를 기입할 경우 단어의 일부 알파벳에 과도하게 걸려 의도치 않은 행까지 대거 필터링되는 오류가 생기므로 구체적인 핵심 자구를 입력하셔야 정합성이 올라갑니다.

계산·사용 가이드

대용량 서버 로그 덤프에서 핵심 에러 행 분리 감별법

접속 통계나 서버 에러 트레이스가 수만 행에 달하는 파일의 경우, 수동으로 오류 지점을 찾는 것은 불가능합니다. 'ERROR'나 특정 IP 대역 등의 타깃 단어 필터를 걸어 포함 추출을 실행하면 디버깅에 요긴한 핵심 증거 행들만 고순도로 응축 편집해 냅니다.

정규표현식(Regex)을 접목한 유연한 패턴 필터링 구축

단순한 글자 매칭을 넘어, 날짜 데이터 패턴(`\\d{4}-\\d{2}-\\d{2}`)이나 우편번호 양식을 지닌 줄만 골라내고 싶을 때는 정규식 스위치를 켜고 패턴식을 기입하면 훨씬 입체적이고 고차원적인 데이터 전처리 추출이 가능합니다.

자주 묻는 질문

대소문자가 혼재된 경우도 인식이 되나요?

예. '대소문자 무시(Case Insensitive)' 스위치를 활성화하시면 영문 대문자, 소문자 표기 격차에 방해받지 않고 스펠링 철자 매칭으로 모든 해당 행을 정확하게 색출합니다.

와일드카드나 정규식 패턴으로 정밀 필터링도 가능한가요?

예. 고급 옵션에서 '정규표현식 지원' 모드를 활성화하면 단순 문자 비교를 넘어 특정 날짜 양식이나 전화번호 형태 등 패턴 기반의 유연한 행 필터 제어가 가능합니다.

관련 도구

  • 접두사/접미사 추가기 - 다량의 텍스트 줄 목록에 대해 각 행의 시작 부분(Prefix)과 끝 부분(Suffix)에 지정한 문자열이나 일련번호를 일괄 합산하여 포맷팅을 1초 만에 완전 자동화해 줍니다.
  • 줄 정렬 도구 - 줄 단위 텍스트 목록을 가나다순(오름차순), 다나가순(내림차순), 알파벳 순서, 글자 길이순, 혹은 랜덤(셔플) 방식으로 기준을 세워 고속 재정렬해 줍니다.
  • 중복 줄 제거기 - 텍스트 목록에서 중복되는 동일한 줄(Line)들을 검색하여 한 행만 남기고 깔끔하게 정리하며, 정렬 조건 및 대소문자 구별 여부를 맞춤 제어합니다.
  • 텍스트 하이라이터 - 장문의 텍스트 본문에서 찾고자 하는 다수의 검색 키워드들을 실시간 탐색하여, 다양한 색상의 형광펜 효과로 입체 강조 표시해 줍니다.
  • 글자 수 계산기 - 입력된 문자열의 공백 포함 및 공백 제외 글자 수를 실시간으로 계산하며 단어 수와 줄 수, 문단 수를 분석합니다.
  • 바이트 계산기 - 입력된 문자열의 바이트 크기를 다양한 인코딩 방식(UTF-8, EUC-KR, UTF-16)에 맞춤 선택하여 실시간으로 계산해 줍니다.