snow · 2026.5.28 06:01 · 조회 0

구글 AI가 'Google'도 못 쓰는 이유 — 대형 언어 모델의 구조적 맹점

AI뉴스LLM구글대형언어모델토크나이저AI한계

구글의 AI가 자사 이름인 'Google'을 비롯해 어떤 단어든 정확히 스펠링하지 못하는 문제가 재조명되고 있다. TechCrunch 보도에 따르면, 이는 단순한 버그가 아니라 대형 언어 모델(LLM)의 근본 작동 방식에서 비롯된 구조적 한계다. AI 업계를 부끄럽게 만드는 이 오류는 사실 업계 전체가 공유하는 문제다.

대형 언어 모델은 텍스트를 '토큰(token)' 단위로 처리한다. 토큰은 개별 글자가 아니라 단어나 단어의 일부로 구성되는 경우가 많다. 예를 들어 'Google'이라는 단어는 모델에게 하나의 의미 덩어리로 인식될 수 있어, "G-o-o-g-l-e 순서대로 써봐"라는 요청에 오류가 발생하기 쉽다. 모델은 단어를 '이해'하는 것처럼 보이지만 실제로는 문자 배열이 아닌 확률적 패턴을 학습하기 때문에, 철자 단위의 조작 과제에 취약하다. 이는 'strawberry'에 'r'이 몇 개인지 틀리는 유명한 사례와 같은 맥락이다.

이 문제는 구글만의 이슈가 아니다. OpenAI의 GPT 시리즈, Anthropic의 Claude 등 현존하는 주요 LLM 모두 정도의 차이는 있지만 같은 취약점을 공유한다. AI가 복잡한 추론이나 코드 생성, 창작은 잘 하면서도 단순해 보이는 철자 확인에서 실수하는 역설적 상황은 사용자 신뢰에 타격을 준다. 특히 AI를 기업 제품에 통합하려는 기업 입장에서는 이런 기초적 오류가 도입 결정에 장애물이 될 수 있다.

이 한계를 극복하기 위해 연구자들은 토크나이저 설계 개선, 문자 수준(character-level) 모델 병렬 활용, 도구 호출(tool-use)을 통한 외부 스펠링 체커 연계 등 다양한 접근법을 탐색 중이다. 단어 의미 이해와 문자 수준 처리 사이의 간극을 좁히는 것이 다음 세대 LLM의 핵심 과제 중 하나로 부상하고 있으며, 이 문제의 해결 여부가 AI 신뢰도를 한 단계 높이는 분기점이 될 것이다.

출처 - https://techcrunch.com/2026/05/27/why-googles-ai-cant-spell-google-or-anything-else/

댓글

아직 댓글이 없습니다.

댓글을 작성하려면 로그인이 필요합니다.