한국어 띄어쓰기 검사 — AI가 사람 편집자만큼 잘할 수 있을까 | 펍스테이션
“이건 띄어 써야 하나, 붙여 써야 하나.” 한국어로 글을 쓰는 사람이라면 누구나 한 번쯤 이 질문에 멈춘다. 띄어쓰기 검사는 한국어 교정의 출발점이지만, AI가 이 작업을 사람 편집자만큼 잘 해낼 수 있을지에 대해서는 의견이 갈린다. 결론부터 말하면 ‘90%는 AI가, 마지막 10%는 사람이’ 처리하는 하이브리드가 가장 효율적이다. 이 글은 그 이유를 단계별로 풀어낸다.
여기서 다루는 도구는 한컴오피스 내장 검사기, MS Word 검사기, 그리고 펍스테이션·다듬이 같은 AI 기반 도구다. 일반 사용자가 일상에서 만날 수 있는 한국어 띄어쓰기 검사기의 거의 모든 유형을 포함한다.
1. 한국어 띄어쓰기가 어려운 이유
한국어 띄어쓰기는 ‘단어와 단어 사이는 띈다’는 원칙 하나로 시작하지만, 적용 단계에서 세 가지가 동시에 겹친다.
- 의존명사 — ‘것·수·바·뿐’ 같은 의존명사는 앞말과 띄어 써야 한다. 그런데 ‘할수있다 vs 할 수 있다’처럼 실제 글에서는 자주 붙여 쓴다.
- 조사 — ‘은/는, 이/가, 을/를’ 같은 조사는 앞말에 붙여 쓴다. 그런데 영어 번역체에서는 종종 띄어 쓰는 실수가 생긴다.
- 복합어 — ‘대학교 vs 대학 교’, ‘한국어 vs 한국 어’ 같은 복합어는 사전 등재 여부에 따라 띄어쓰기가 갈린다.
국립국어원 한글맞춤법 제2항에서 ‘문장의 각 단어는 띄어 쓴다’를 원칙으로 명시했지만, ‘다만 조사는 앞말에 붙여 쓴다’ 같은 예외가 잇따른다. 한국어를 모국어로 사용하는 사람도 100% 정확히 띄어 쓰는 것은 사실상 불가능하다.
2. AI 띄어쓰기 검사의 원리 — 통계 vs 규칙 vs LLM
‘AI 띄어쓰기’라는 표현 안에는 사실 세 가지 다른 기술이 섞여 있다.
2-1. 통계 기반 (n-gram)
대량의 한국어 문장 코퍼스에서 ‘앞 단어 + 뒤 단어’가 띄어졌는지 붙었는지의 빈도를 학습한다. 부산대·네이버 맞춤법 검사기 초기 버전이 이 방식을 썼다. 빠르지만 새로운 단어·고유명사에 약하다.
2-2. 규칙 기반
한글맞춤법 규정을 코드로 옮긴다. 조사·의존명사·복합어 등을 사전에 등재해 매칭한다. 한컴오피스 내장 검사기가 대표적이다. 사전에 없는 신조어·고유명사는 잘 처리하지 못한다.
2-3. LLM 기반
GPT-5·Gemini 2.5 같은 대형 언어 모델이 문맥 전체를 이해하면서 띄어쓰기를 판단한다. ‘이번 주는 한국 어디로 갈까?’와 ‘한국어 띄어쓰기를 배웠다’의 ‘한국 어’를 다르게 처리할 수 있다. 펍스테이션·다듬이 등 최근 AI 도구가 여기에 해당한다.
같은 ‘AI 띄어쓰기’라도 어떤 기술 위에 서 있는지에 따라 결과가 달라진다.
3. 실제 문장 비교 테스트
한국어 띄어쓰기 규칙이 명확히 적용되는 문장과, 사람조차 판단이 갈리는 문장을 섞어서 테스트해 보자.
| 입력 | 한컴·MS | AI 도구 |
|---|---|---|
| 할수있다 | 할 수 있다 | 할 수 있다 |
| 대학교에가서 | 대학교에 가서 | 대학교에 가서 |
| 그것뿐만아니라 | 그것뿐만 아니라 | 그것뿐만 아니라 |
| 안녕하세요반갑습니다 | 안녕하세요 반갑습니다 | 안녕하세요. 반갑습니다. |
| 한국어공부 | 한국어 공부 | 한국어 공부 / (문맥상) 한국어공부 |
일반적인 띄어쓰기는 모든 도구가 무난히 잡는다. AI 도구가 우위를 보이는 곳은 ‘문장부호 보완’과 ‘문맥에 따른 복합어 판단’이다. 사람 편집자라면 굳이 신경 쓰지 않을 사소한 부분도 LLM 기반 도구는 일관되게 채워 준다.
4. 사람 편집자가 잡는 미묘한 케이스 5가지
‘조사 띄어쓰기’와 ‘의존명사’를 넘어, 사람 편집자만이 잡아내는 케이스가 있다.
- 저자 의도 표기 — 시인이 일부러 ‘붙여 써서’ 의미를 강조한 부분. AI는 ‘오타’로 보고 고치려 한다.
- 고유명사 변형 — ‘OO그룹’ ‘OO 그룹’ 같은 회사명 표기. 회사가 공식적으로 정한 표기에 맞춰야 한다.
- 외래어 + 한국어 결합 — ‘웹사이트’ vs ‘웹 사이트’ 등. 매체별 스타일가이드가 다르다.
- 대화체 줄임말 — ‘그쵸’ ‘아니에요’ 같은 비표준 표현은 캐릭터 톤을 위해 일부러 유지한다.
- 장르 관습 — 시·소설·신문 기사·논문이 서로 다른 띄어쓰기 관습을 갖는다.
이 5가지는 ‘맞춤법 규정 외’의 영역이다. 사전이나 규정만 보고는 결정할 수 없고, 글 전체 맥락과 저자의 의도를 이해해야 한다.
5. AI + 사람 하이브리드가 답이다
그렇다면 어떻게 써야 할까. 가장 효율적인 워크플로우는 다음과 같다.
- 1차: AI — 책 한 권·논문 한 편을 AI 도구에 통째 업로드. 90% 이상의 일반적 띄어쓰기·조사·맞춤법을 한 번에 처리.
- 2차: 변경 추적 검토 — Word·한컴의 ‘변경 추적’ 결과물에서 AI 제안을 사람이 ‘적용/거부’로 결정. 저자 의도가 살아 있는 부분은 거부.
- 3차: 사람 편집자(선택) — 출판 직전 사람 편집자가 ‘장르 관습·고유명사·캐릭터 톤’을 다시 본다.
이 흐름에서 AI가 절약해 주는 시간은 80~90%다. 사람 편집자는 모든 띄어쓰기를 처음부터 끝까지 보는 대신, AI가 처리한 결과를 검토하기만 하면 된다.
6. 결론
‘AI가 사람 편집자만큼 띄어쓰기를 잘 할까?’의 답은 ‘분량과 종류에 따라 다르다’이다. 책 한 권 분량의 일반적인 띄어쓰기·조사 교정은 AI가 사람보다 더 일관되고 빠르게 처리한다. 반대로 시·소설의 의도된 표기, 회사명·고유명사, 장르 관습은 사람의 손길이 필요하다.
지금 자신의 원고가 ‘일반 본문 80% + 의도된 표기 20%’ 구조라면, AI로 80%를 빠르게 다듬고 20%만 본인이 검토하는 방식을 추천한다. 펍스테이션은 회원가입 즉시 월 10만자 무료 체험이 부여된다. 본인 원고의 띄어쓰기를 직접 돌려보고, AI가 어디를 잡고 어디를 놓치는지 확인해 보길 권한다.
지금 AI 띄어쓰기 검사 월 10만자 무료 체험하기. 회원가입 즉시 시작. PRO 첫 결제 100원 이벤트 진행 중.
관련 글
본 글은 펍스테이션(PubStation Co., Ltd.)이 2026년 5월 11일에 발행한 한국어 띄어쓰기 검사 가이드입니다.