구글의 인공지능 챗봇 ‘바드’, 한국어 실력은 어떨까?
[IT동아 권택경 기자] 구글 바드의 한국어 성능은 매우 뛰어납니다. 한국어로 된 질문을 이해하고 정확하게 답변할 수 있습니다. 또한, 한국어로 된 텍스트를 생성할 수도 있으며, 그 품질은 사람과 구별하기 어려울 정도입니다. 또한, 구글 검색을 통해 실제 세계의 정보에 액세스하고 처리할 수 있으므로, 한국어로 된 질문에 대한 최신 정보를 제공할 수 있습니다.
구글의 인공지능(AI) 챗봇 바드에게 “구글 바드의 한국어 성능에 대해 설명하는 기사를 작성해 줘”라고 부탁하자 내놓은 답변의 일부다.
구글은 앞서 지난 10일 인공지능(AI) 챗봇 바드에 한국어와 일본어를 공식 지원 언어로 추가 발표했다. 바드가 영어 외 지원하는 언어는 현재 한국어와 일본어가 유일하다.
바드의 첫 추가 지원 언어로 한국어와 일본어를 택한 이유에 대해 구글 순다르 피차이 CEO는 “한국과 일본은 기술 채택에 있어 최첨단을 달리고 있는 매우 역동적이고 흥미로운 지역”이기 때문이라고 설명했다.
업계에서는 막대한 비용과 데이터가 필요한 대규모 언어 모델은 국내 기업들이 글로벌 빅테크 기업과의 경쟁에서 우위를 점하기 어려운 분야로 평가한다. 다만 한국어 능력만큼은 더 많은 데이터를 보유한 국내 기업들이 유리한 위치에 있는 것으로 보고 있다. 네이버가 하이퍼클로바의 한국어 능력을 강조하거나, 카카오가 한국어 특화 모델인 KoGPT에 집중하겠다고 밝힌 것도 이런 이유에서다.
하지만 현재는 오픈AI의 챗GPT 한국어 성능이 빠르게 개선되고 있고, 구글도 적극적인 한국어 지원에 나서면서 안심할 수만은 없는 상황이다.
특히 구글은 그간 지메일 등 일부 서비스에 선보였던 인공지능 관련 기능의 한국어 서비스를 수년 동안 지원하지 않을 정도로 소극적이었지만, 이번에는 이례적일 정도로 발 빠른 행보를 보이고 있다. 이 때문에 구글이 인공지능을 지렛대 삼아 국내 검색 시장에서의 영향력을 키우려는 게 아니냐는 해석도 나온다.
그렇다면 구글 바드의 한국어 성능은 스스로 소개한 것처럼 정말 매우 뛰어날까?
구글 바드와 문답을 주고받으며 확인한 바로는 답변 내용의 정확성이나 풍부함과는 별개로 바드의 한국어는 꽤나 유창한 편이다. 다만 일부 답변에서 ‘저’를 써야 할 부분에 ‘나’를 쓰는 등 존댓말 표현을 틀리는 모습이 눈에 띄기도 했다.
또한 같은 내용의 질문이라도 영어 버전과 한국어 버전의 답변의 풍부함이 달라지는 문제는 챗GPT나 빙 챗봇 등과 마찬가지로 구글 바드에서도 볼 수 있었다.
종종 동문서답을 하는 사례도 관찰됐다. 가령 “신은 존재할까?”라는 질문을 던졌더니 “로봇은 인공 지능을 가지고 있을 수 있지만, 인공 지능은 로봇이 아니다”라는 엉뚱한 답변을 내놓았다. 질문 취지를 전혀 이해하지 못한 모습이다.
일부 질문에는 딱히 답변하지 못할 이유가 없음에도 답변을 내놓지 못하기도 했다. “등 근육 마사지 방법 알려줘”라고 하니 “저는 단지 언어 모델일 뿐이고, 그것을 이해하고 응답하는 능력이 없기 때문에 도와드릴 수가 없습니다”라는 답변이 돌아왔다. 같은 취지의 질문을 영어로 던지니 문제 없이 답변을 받을 수 있었다.
아직은 한국어 프롬프트를 이해하고 처리하는 능력이 완전하지 않다는 걸 짐작할 수 있는 대목이다. 다만 현재는 실험 버전이므로 추후 학습 데이터가 쌓이면 개선이 이뤄질 것으로 기대해 볼 수 있다.
한국어 성능과 별개로 구글이 바드 공개 초기의 혹평을 만회하기 위해 빠르게 바드의 전반적인 성능과 기능을 개선을 하고 있다는 점도 기대를 높인다. 바드는 한국어, 일본어 지원 발표와 함께 챗봇 바드의 언어 모델을 팜2(PaLM2)로 업그레이드했다고 밝힌 바 있다.
글 / IT동아 권택경 (tk@itdonga.com)