[리뷰] 언어장벽을 없애기 위한 네이버의 도전, 파파고

강일용 zero@itdonga.com

[IT동아 강일용 기자] 머신러닝(기계학습) 기술이 무르익으면서 머신러닝을 활용한 다양한 기술이 속속 등장하고 있다. 기계가 데이터를 수집, 분석한 후 이를 바탕으로 스스로의 성능을 개선할 수 있으니, 과거 사람이 직접 기계의 성능을 개선할 때보다 효율이 훨씬 뛰어나다.

머신러닝을 활용해 성능을 개선한 대표적인 서비스가 바로 번역이다. 수 많은 대화와 문서를 수집하고 최적의 번역 결과를 찾은 후 이를 바탕으로 변역 품질을 향상시키고 있다. 선두주자는 구글이다. 구글은 자사의 번역 서비스 '구글 번역'에 머신러닝을 도입한 후 번역 품질을 지속적으로 향상시키고 있다. 머신러닝의 사례로 알파고보다 오히려 이쪽을 더 강조할 정도다.

국내 업체도 가만히 구경만 하고 있는 것은 아니다. 머신러닝 자체는 이미 개발된지 오래된 기술이고, 관련 인력도 충분하다. 지속적으로 투자와 연구를 해왔다면 구글에 뒤질 이유가 전혀 없다. 국내에는 구글 못지않게 머신러닝에 투자와 연구를 해온 기업이 있다. 바로 국내의 대표 IT 기업 네이버다.

오늘(9일) 네이버가 머신러닝을 활용한 모바일 번역 서비스 '파파고(Papago)'를 사용자들에게 선보였다. 파파고는 에스페란토어로 앵무새를 뜻한다. 사람이 한 말을 앵무새가 따라하는 것처럼 파파고는 사람이 한 말을 따라하고 이를 번역해주겠다는 의미를 담았다.

네이버 파파고
네이버 파파고
<네이버의 모바일 번역 서비스 파파고>

파파고, 한영 번역의 아쉬움을 해결하다

파파고는 한국어, 일본어, 중국어, 영어 등 4개국어를 지원한다. 텍스트, 음성 뿐만 아니라 사진 속 문자를 인식한 후 번역(사진 번역)할 수도 있다.

솔직히 말해 파파고는 아직 갈 길이 멀다. 이제 시작에 불과하다. 경쟁 상대인 구글 번역은 103개 언어(전 세계 언어의 99%)를 지원한다. 사진 번역을 지원하는 언어도 37개나 된다(한국어 포함).

하지만 번역할 수 있는 언어가 많다고 해서 구글 번역이 파파고보다 우월하다고 할 수는 없다. 번역 서비스의 가장 중요한 부분인 번역 품질면에서 파파고가 더 뛰어나기 때문이다.

구글 번역의 가장 큰 약점은 한영/영한 번역이다. 구글에 한국어 데이터와 한국어에 대한 이해가 높은 엔지니어가 부족하기 때문일까? 구글 번역의 한영/영한 품질은 실제로 활용할 수 있을 만한 수준이 못된다. 현재는 외국 여행에 나가서 참고용으로 쓰거나, 간단한 문장을 번역하는 정도로만 활용되고 있다. 오죽하면 구글 번역으로 한국어에서 영어로 번역하고 싶다면 한국어 > 일본어 > 영어 순으로 번역하는게 더 낫다는 말까지 나왔겠는가. (실제로도 그렇다. 한일 번역과 일영 번역은 한영 번역보다 데이터가 훨씬 많기 때문에 더욱 자연스럽게 번역된다)

네이버가 한영/영한 번역에 많은 공을 들였기 때문일까? 파파고는 베타 버전임에도 불구하고 제법 쓸만한 한영/영한 번역을 보여준다. 운치있는 표현을 쓰거나, 중의적인 표현을 쓰더라도 문맥을 통해 뜻을 읽은 후 자연스럽게 번역해준다. 물론 완벽하다는 것은 아니다. 파파고로 나온 번역 결과물도 원어민이 보기에는 어색한 점이 많다. 하지만 아예 뜻 자체가 달라지는 일이 비일비재한 구글 번역에 비하면 양반이다.

네이버 파파고
네이버 파파고
<구글 번역(좌)과 파파고(우)의 한영 번역>

한국어 음성 인식 기능도 뛰어나다. 우물우물 말하면 알아듣지 못하는 점은 구글 번역과 동일하지만, 크고 또렷하게 말하면 구글 번역과 달리 구별하기 힘든 발음까지 모두 제대로 인식한다. 말이 조금 빨라도 인식하는데 아무런 문제가 없다. 오히려 너무 느리게 말하면 인식률이 떨어지니 참고하자.

한일/일한 번역의 경우 구글 번역과 파파고의 번역 품질이 대동소이하다. 둘 다 한자를 정확히 뜻 풀이하고, 외래어는 가타가나로 표시해주는 센스를 발휘한다. 한중/중한 번역은 기자가 중국어를 전혀 못하는 관계로 확인해보지 못하는 점이 아쉽다. 이 부분은 파파고의 사용자가 늘어나면 따로 확인이 필요하다.

파파고의 주요 기능

파파고는 텍스트 번역, 음성 번역, 상호 번역, 사진 번역 기능을 제공한다.

텍스트 번역은 말 그대로 글자를 번역하는 기능이다. 4개국어를 입력하면 다른 나라 언어로 바로 번역해준다. 제법 긴 문장도 빠르게 번역해준다. 번역할 수 있는 문장 길이의 한계가 있기 때문에 장문은 끊어서 번역해야 한다. 한 번에 약 3,500자 내외의 글자를 번역할 수 있다.

음성 번역은 사용자의 음성을 인식한 후 이를 다른 언어로 출력해주는 기능이다. 문자와 음성으로 동시에 번역해준다. 외국인에게 전달하고 싶은 말이 있거나, 외국인이 하는 말을 알아듣기 힘들 경우 파파고의 음성 번역을 활용해보자. 보다 쉽게 상대방에게 뜻을 전달할 수 있다.

상호 번역은 음성 번역의 발전판이다. 외국인과 오랫동안 대화를 나눌 수 있도록 두 개의 입력 아이콘을 제공한다. 자신이 말할 차례에 입력 아이콘을 클릭하고 말하면 상대방의 언어로 번역해서 들려준다. 상대방 역시 자신의 차례에 아이콘을 누르고 말하면 사용자가 알아들을 수 있도록 번역된다.

네이버 파파고
네이버 파파고
<음성 번역(좌)과 상호 번역(우)>

사진 번역은 카메라로 사진을 촬영한 후 번역하고 싶은 문자를 긁으면 해당 문자를 번역해주는 기능이다. 외국어로 적혀있는 게시글, 안내판 등을 번역하고 싶을 때 유용하다.

네이버 파파고
네이버 파파고

<사진 번역>

또, 글로벌 회화 기능도 제공한다. 외국에서 식당, 호텔, 교통 등을 외국에서 불편함 없이 이용할 수 있도록 다양한 상황에 맞춰 최적의 번역 문장을 제공하는 기능이다.

네이버 파파고
네이버 파파고
<글로벌 회화, 다양한 예문을 제공해 여행자들의 불편함을 최소화했다>

부족한 편의성, 지속적인 업데이트가 필요

파파고는 번역에 관련된 필수 기능만 갖추고 있다. 편의성에 관련된 부분은 경쟁 서비스 구글 번역에 비해 많이 부족하다. 예를 들어 구글 번역의 경우 웹 페이지에서 외국어를 드래그/복사하면 구글 번역 앱을 실행하지 않아도 이를 즉시 번역해주는 '탭 하여 번역' 기능을 갖추고 있다. 사진 번역 부분도 마찬가지다. 구글 번역은 사진을 촬영하지 않고 스마트폰만 해당 게시글, 안내판에 가져다 대면 바로 화면에 번역해주는 '워드렌즈' 기능도 갖추고 있다.

무엇보다 오프라인 번역 기능이 없는 점이 아쉽다. 구글 번역은 스마트폰에 미래 해당 '랭기지팩'을 다운로드해두면 인터넷에 연결되어 있지 않아도 기초적인 번역을 수행할 수 있다(번역 품질은 인터넷에 연결되어 있을 때보다 조금 떨어진다). 반면 파파고는 인터넷 연결이 끊기면 번역 기능을 이용할 수 없다. 인터넷 상황이 열악한 지역에서 번역 서비스를 이용하고 싶을 때 둘의 편의성 차이가 확 눈에 띈다.

물론 파파고는 이제 시작한 서비스라는 점을 감안해야 한다. 지금은 베타 서비스에 불과하다. 편의성과 지원 언어는 추후 향상될 여지가 있다. 구글 번역의 경쟁자를 자처하는 만큼 구글 번역 못지 않은 다양한 편의 기능을 제공할 것이라고 믿는다. 네이버도 파파고에 베타 버전임을 표시하고, 많은 사용자의 참여를 독려하고 있다. 사용자가 늘어날 수록 번역 데이터를 더욱 많이 수집할 수 있고, 그만큼 번역 능력도 향상되기 때문이다.

안드로이드용 파파고는 구글 플레이 스토어와 원스토어에서 무료로 내려받을 수 있다. iOS용 파파고는 다음달 출시될 예정이다. 네이버 관계자는 "파파고가 2018 평창 동계 올림픽 등을 맞아 내한하는 외국인들에게도 유용한 통역 앱으로 활용될 수 있도록 품질 고도화에 집중해나갈 계획이다"고 밝혔다.

글 / IT동아 강일용(zero@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.