한글 자모 분리/조합기
한글 문장을 낱자 단위의 모음과 자음으로 완전히 쪼개거나(예: '한글' → 'ㅎㅏㄴㄱㅡㄹ'), 역으로 흩어진 자모 낱자들을 해독하여 결합된 완성형 한글 음절로 깔끔하게 역조립해 줍니다.
카테고리: 텍스트 도구
언제 사용하나요?
국어 음운 분석 연구 데이터 정제, 시스템 오류나 키보드 문제로 인해 조합이 깨져 `ㅇㅏㄴㄴㅕㅇ`으로 송출된 문자 메시지의 긴급 복구, 자소 기반 자연어 처리 및 AI 음성 합성 텍스트 전처리 데이터 구축 시 양방향 한글 가공을 즉시 완료하고자 할 때 최적입니다.
사용 방법
- 작업할 텍스트를 입력창에 넣고 원하는 모드('자모 분리' 또는 '자모 조합')를 설정합니다.
- 조합형 상태 머신 오토마타 옵션(쌍자음 분해 수준 등)을 체크합니다.
- 음절이 완벽히 쪼개지거나 단단하게 조립된 한글 가공 아웃풋을 복사해 사용합니다.
입력값 안내
낱자 자음/모음 나열 텍스트나 완성형 한글, 그리고 한글 이외의 문자가 뒤섞인 데이터를 고루 수용합니다.
계산·변환 기준
자모 분해 시에는 완성형 한글 코드 분석식(`몫과 나머지 계산`)을 활용해 초성, 중성, 종성 유니코드 배열 원소를 차례대로 슬라이싱 도출합니다. 자모 조합 시에는 자소 인접 순서 흐름에 따라 초성->중성->종성 상태 전이를 연산하는 한글 오토마타 조립 상태 기계를 가동하여 2바이트 완성 음절 코드로 일체 복원 가공합니다.
사용 예시
- 깨진 풀어쓰기 메시지 완전 복원 - 모바일 웹 텍스트 인코딩 문제로 자모음이 다 흩어진 채 읽기 힘든 텍스트를 원래 문장으로 말끔히 조립합니다.
- 형태소 및 자소 단위 빈도 연구 - 국어 말뭉치(Corpus) 연구 시, 단순 음절 수준을 넘어 낱개 자소 단위의 발음 음운 변동 통계를 산출합니다.
- 글꼴 디자인 낱자 검수 테스트 - 신규 서체 폰트 렌더링 검사 시 자소 조합 상태의 물리적 위치 픽셀 어긋남을 점검하는 입력 데이터를 발행합니다.
예시
- 바다 분리 → ㅂㅏㄷㅏ (초성/중성 1:1 분해)
- ㅎㅏㄴㄱㅡㄹ 조합 → 한글 (풀어쓰기 자모를 온전한 한글 단어로 복구)
주의사항
- 조합 알고리즘은 표준 한글 결합법(초성+중성+[종성]) 문법 룰을 준수하므로, 무의미한 자음의 단순 나열(예: `ㅂㅂㅂㄷㄷ`)이나 모음 단독 나열은 조합되지 않고 원래 낱자 상태 그대로 출력됩니다.
계산·사용 가이드
한글 오토마타(State Machine) 상태 전이와 음절 조합 규칙
풀려진 자모음 문자열을 완성형 음절로 재조합하려면, 자음 및 모음이 번갈아 배치되는 국어 결합 흐름을 인식하는 오토마타 상태 전이 로직이 구동되어야 합니다. 앞 글자가 받침으로 갈지, 다음 글자의 초성으로 밀릴지를 실시간 연산하여 매끄러운 단어로 복구합니다.
자소 분석을 이용한 한국어 자연어 처리(NLP) 전처리 기술
인공지능 한글 음성 합성(TTS)이나 텍스트 마이닝 작업 시, 음절 단위 분석은 세부 음운 규칙을 설명하기 어렵습니다. 텍스트 코퍼스를 자소 단위로 낱낱이 쪼갠 풀어쓰기 가공을 통해 고정밀 언어 모델 학습 데이터를 확보합니다.
자주 묻는 질문
쌍자음(ㄲ, ㄸ)이나 겹모음(ㅝ, ㅟ)도 더 쪼개질 수 있나요?
예. 세부 분리 설정을 통해 복합 자모음까지 낱글자 시드(예: `ㄲ` → `ㄱㄱ`, `ㅝ` → `ㅜㅓ`)로 완전히 해체할지, 하나의 독립된 자모 자격 유니코드 기호로 존치할지 정밀 필터링할 수 있습니다.
텍스트에 영어와 숫자가 혼합되어 있어도 동작하나요?
예. 한글 조합형 규격에 부합하지 않는 라틴 문자, 숫자, 문장 기호는 연산 상태 기계에서 바이패스하여 오리지널 위치에 온전히 남깁니다.
관련 도구
- 초성 추출기 - 한글 텍스트를 정밀 분석하여 글자의 첫소리 자음인 초성(예: '안녕하세요' → 'ㅇㄴㅎㅅㅇ')만 고순도로 필터링하여 일괄 추출해 줍니다.
- 한국어 조사 도우미 - 텍스트 내의 단어와 임시 조사 매크로 기호(예: [은/는], [이/가], [을/를])를 분석하여, 앞 단어 끝글자의 받침 존재 여부에 걸맞은 올바른 맞춤법 조사로 실시간 자동 교정 치환해 줍니다.
- 한영타 변환기 - 영문 키보드 상태에서 타이핑한 한글 문자열이나 한글 자판 상태에서 입력한 영어 문자열을 원래 의도한 언어로 실시간 교정 및 양방향 변환해 줍니다.
- 글자 수 계산기 - 입력된 문자열의 공백 포함 및 공백 제외 글자 수를 실시간으로 계산하며 단어 수와 줄 수, 문단 수를 분석합니다.
- 바이트 계산기 - 입력된 문자열의 바이트 크기를 다양한 인코딩 방식(UTF-8, EUC-KR, UTF-16)에 맞춤 선택하여 실시간으로 계산해 줍니다.
- 대소문자 변환기 - 영문 텍스트를 대문자, 소문자, 단어 첫 글자 대문자(Title Case), 문장 첫 글자 대문자(Sentence Case) 등으로 한 번에 일괄 변환해 줍니다.