카카오 AI 번역 승부수..."높임말 구분하는 번역앱으로 차별화"
[IT동아 강일용 기자] 카카오가 신경망 번역 서비스를 상용화하는 등 인공지능 시장 개척에 본격적으로 나선다. 기술 기업으로서 면모를 과시하고 새로운 먹거리로 떠오르고 있는 인공지능 시장에서 구글, 네이버 등 경쟁사에 뒤처지지 않기 위함이다.
카카오는 클라우드, 인공지능, 로봇 등 첨단 기술에 집중하고 있는 네이버와 달리 온라인과 오프라인의 결합(O2O)을 통한 사용자 경험 혁신에 기업의 역량을 집중하고 있었다. 하지만 그렇다고 해서 첨단 기술 개발을 소홀히 한 것은 아니다. 내부에서 다양한 인공지능 기술 개발을 진행하고 있었다. 이번에 선보이는 신경망 번역 서비스 역시 그러한 노력의 일환이다.
<배재경 카카오 인공지능부문 컨텍스트 파트장>
카카오의 인공지능 플랫폼 '카카오 I'
카카오는 보고, 듣고, 읽을 수 있는 능력을 갖춘 인공지능 모델을 만든 후 이를 활용해 다양한 인공지능 서비스를 출시할 계획이다. 이러한 통합 인공지능 기술의 이름을 '카카오 I(아이)'라고 지었다. 카카오 I는 음성 엔진(말하는 능력, 음성 인식), 시각 엔진(보는 능력, 컴퓨터 비전), 대화 엔진(읽는 능력, 자연어 처리) 등 인공지능의 세 가지 핵심 능력뿐만 아니라 추천 엔진(빅데이터와 기계학습 기반의 추천 기술)과 번역 엔진(다국어 번역 처리 기술) 등 인공신경망(딥러닝) 기술을 활용한 서비스까지 함께 제공한다.
카카오는 카카오 I를 자사 서비스 전반에 확대 적용할 계획이다. 다음뉴스 및 검색, 카카오맵, 카카오택시 및 내비, 카카오페이지, 카카오버스, 카카오TV 등 카카오의 모든 서비스에서 인공지능 기술을 경험할 수 있다. 카카오는 이렇게 개발한 인공지능 기술을 자사 내에서만 이용하지 않고 외부 파트너들에게 공개해, 궁극적으로 카카오 I 인공지능 생태계를 만들어나갈 계획이다.
조금 늦었지만 품질은 자신있다
물론 이러한 카카오의 움직임이 완전히 새로운 것은 아니다. 구글, 네이버 등 경쟁사는 이미 2~3년 전부터 번역, 취향 추천, 사진 정리 등 다양한 인공지능 서비스를 출시해 시장을 선점했다. 예를 들어 네이버의 경우 2016년 8월, 구글의 경우 2016년 11월 자사의 번역 서비스에 인공지능 기술을 도입했다. 반면 카카오는 이보다 1년 정도 늦은 2017년 9월부터 인공지능 기술(카카오 I)을 도입한 번역 서비스 '카카오 I 번역'의 베타 서비스를 실시했다. 정식 서비스는 올해 2월 말 시작할 예정이다.
하지만 카카오는 자신있어 하는 눈치다. 비록 서비스 상용화는 경쟁사보다 늦었지만, 서비스 품질은 경쟁사와 대등하거나 오히려 낫다는 설명이다. 배재경 카카오 인공지능부문 컨텍스트 파트장은 "카카오 I 번역의 품질을 자체 테스트한 결과 영한번역은 경쟁사들보다 우수하고, 한영번역은 대등한 결과물을 내놨다"며, "중국어 번역 결과물도 경쟁사보다 우수하고, 일본어 번역도 경쟁사보다 결코 떨어지지 않는다"고 자신했다.
신경망 번역이란?
카카오 I 번역에는 신경망 기반의 기계번역(Neural Machine Translation, NMT) 기술이 적용되어 있다. NMT란 어떤 기술일까?
번역 서비스는 크게 3가지 단계로 나눌 수 있다. 첫 번째는 '어구 기반 기계 번역(Phrase Machine Translation, PMT)'이다. 문장을 단어 또는 어구 단위로 나눠서 번역한 후 번역한 결과물을 조립해서 출력하는 방식이다. 외국어을 잘 모르는 사용자가 사전만 펴놓고 번역을 진행하는 것으로 이해하면 된다. 1950년대 컴퓨터가 처음 등장했을 때 고안된 방식으로 이후 30년 동안 이용되었다. 하지만 어구 기반 기계 번역은 번역한 단어를 조립하면서 문법 오류가 자주 발생하기 때문에 문법 구조가 다른 언어를 제대로 번역하지 못하는 문제가 있었다. 또, 다의어 번역시 애로사항이 많았다. 여러가지 의미 가운데 무엇을 선택해야 하는지 제대로된 기준이 없었기 때문이다. 때문에 이 기술을 통해 번역된 문장은 기대 이하의 품질로 나오기 일쑤였다.
이러한 어구 기반 기계 번역의 문제를 해결하기 위해 등장한 방식이 '통계 기반 기계 번역(Statistical Machine Translation, SMT)'이다. 1988년 IBM이 모델1을 통해 처음 선보인 번역 방식으로, 수 많은 번역 데이터를 수집해 통계를 낸 후 이 가운데 가장 널리 이용되는 번역 방식을 활용하는 기술이다. '많이 이용되는 것이 옳은 것이다'는 이론을 따르고 있는 것. 통계 기반 기계 번역은 어구 기반 기계 번역의 가장 큰 약점인 다의어 번역 불가를 해결할 수 있는 혁신적인 방식이었다. 많이 이용되는 것이 옳은 것이다는 번역 기준을 제시했기 때문. 특히 인터넷 시대에 접어들어 수 많은 번역 데이터를 수집할 수 있게 됨에 따라 통계 기반 기계 번역의 품질은 크게 향상되었다. 일반인이 보기에는 여전히 어색한 형태로 번역되었지만, 그래도 뜻을 이해하는데 큰 문제는 없을 정도였다. 사용자가 접할 수 있는 시중의 번역 서비스 대부분이 동계 기반 기계 번역 기술을 활용해 서비스를 제공했다.
하지만 통계 기반 기계 번역도 여전히 문제는 존재했다. 문법이 다른 언어는 어색하기 짝이 없게 번역되었고, 사용자가 적어 번역 데이터가 부족한 언어는 여전히 제대로 번역할 수 없었다.
2016년에 들어 번역 서비스는 세 번째 도약을 하게 된다. 이것이 바로 NMT다. 인공지능 구현의 핵심 기술인 머신러닝(기계 학습)과 딥러닝(인공 신경망)을 활용해 특정 언어를 번역할 수 있는 모델(인공지능)을 만든 후 해당 모델을 활용한 번역 서비스를 제공하는 기술이다. 수 많은 인공 신경망으로 구성되어 있는 인공지능이 데이터를 학습해 스스로의 번역 성능을 강화하는 기술이다. 바둑 인공지능 알파고가 수 많은 자체 대국으로 기력을 향상시킨 것과 동일한 원리다.
신경망 번역의 가장 큰 장점은 사람처럼 문장을 인식해서 번역한다는 것이다. 특정 국가의 원어민은 해당 언어를 읽을 때 단어과 어구를 구별해서 읽지 않는다. 문장 전체를 한 눈에 파악한 후 바로 뜻을 이해한다. 신경망 번역도 마찬가지다. 문장 전체를 이해한 후 번역을 진행한다. 때문에 문법이 다른 언어도 제대로 번역되고, 다의어도 문장 전체의 흐름 속에서 알맞는 것을 찾아낸다.
무엇보다 신경망 기반 기계 번역은 인공지능이 성능을 강화하면 강화할 수록 번역 능력도 함께 향상되는 장점이 있다. 현재는 70~80% 정도의 정확도를 보여주지만, 언젠가는 정확도가 99%까지 향상될지도 모를 일이다. (신경망 번역과 동일한 기술을 이용하는 이미지 인식 인공지능의 경우 이미 정확도가 97%까지 향상된 상태다.) 신경망 번역의 정확도가 90%를 넘으면 사람을 대신해 번역을 맡겨도 될 정도로 수준 높은 번역 품질을 보여줄 것으로 기대받고 있다.
카카오 번역의 경쟁력 '에이블루얼라인'
카카오는 경쟁사보다 상용화가 늦다는 약점을 따라잡기 위해 인공지능이 보다 쉽고 빠르게 데이터를 학습할 수 있게 해주는 도구인 'ABLEU align(에이블루얼라인)'을 개발했다.
에이블루얼라인은 인공지능이 언어를 보다 정확하게 이해할 수 있도록 데이터를 기계번역이 쉬운 문장 단위로 가공해주는 도구다. 에이블루얼라인을 통해 카카오 I는 같은 데이터를 학습하더라도 경쟁사의 인공지능보다 더 뛰어난 성능을 갖출 수 있었다. 예를 들어 에이블루얼라인 덕분에 카카오 I 번역은 '예쁘다'라는 표준어 뿐만 아니라 '이쁘다' 같은 유사어도 학습 데이터로 이용할 수 있었고, 번역의 정확도와 품질을 크게 끌어올릴 수 있었다.
높임말도 알아듣는다... 진화하는 번역 서비스
카카오 I 번역은 2월 말 지원하는 언어를 늘리고 번역 챗봇을 출시하면서 베타라는 꼬리표를 떼고 정식 서비스에 나선다. 현재는 한영/영한 번역만 지원하고 있지만, 곧 일본어/중국어 번역도 추가할 예정이다. 번역 챗봇도 출시한다. 카카오톡 I 번역 챗봇은 카카오톡 내부의 '플러스친구' 형태로 제공된다. 이를 통해 사용자는 카카오톡을 이용하던 도중에도 별도의 앱이나 서비스를 실행하지 않고 번역 서비스를 이용할 수 있다. 정식 서비스와 함께 현재 200자 내외에 머무르고 있는 1회 번역량을 5000자 수준으로 확대해 경쟁자와 대등하게 끌어올릴 계획이다.
올해 상반기에는 문체 제어 기능을 도입할 계획이다. 한국어 특유의 예사말(평어)/높임말(경어)을 인식하고 이에 알맞는 번역 결과를 제공하는 기능이다. 높임말뿐만 아니라 구어체와 문어체도 구분해서 번역 결과를 내준다. 이는 경쟁사에서 찾아볼 수 없는 카카오 I 번역만의 강점이다. 현재 대부분의 번역 서비스는 높임말을 인식하지 못하고 예사말로 일괄 번역해주고 있다.
카카오 I 번역은 먼저 홈페이지와 카카오톡을 통해 제공될 계획이지만, 올해 내로 전용 앱도 출시할 예정이다. 전용앱은 번역 엔진뿐만 아니라 시각 엔진과 음성 엔진도 탑재해 대화형 번역(사람의 말을 번역해서 음성으로 들려주는 것)과 문자 인식 번역 등 수준 높은 번역 서비스를 제공한다.
카카오의 다양한 서비스에도 카카오 I 번역이 적용될 예정이다. 사용자는 카카오미니 같은 인공지능 스피커를 통해 번역 서비스를 이용할 수 있다. 또한 다음 홈페이지에서 제공하는 뉴스 콘텐츠도 카카오 I 번역을 활용해 해외 사용자들이 좀 더 쉽게 접근할 수 있게 할 예정이다. 유튜브 번역처럼 카카오TV 내 동영상 자막에도 번역 기능을 탑재하기 위해 준비 중이다.
카카오 I 번역 기술은 카카오만 이용할 수 있는 기술이 아니다. 카카오는 카카오 I 번역 API를 외부에 공개해 기업과 개인 누구나 카카오 I 번역 기술을 활용한 서비스를 개발할 수 있도록 할 계획이다. 배재경 파트장은 "번역 API 이용료에 대해서 정해진 것은 아직 아무것도 없지만, 다른 업체들과 유사한 수준으로 책정하지 더 비싼 경우는 결코 없을 것"이라고 설명했다.
글 / IT동아 강일용(zero@itdonga.com)