인간보다 뛰어난 번역 결과 내놓겠다, 기계번역 엔진 PNMT 출시
[IT동아 이상우 기자] 시스트란인터내셔널이 인공신경망과 딥러닝을 바탕으로 30개 이상의 언어를 지원하는 기계번역 엔진 'PNMT(Pure Neural Machine Translation)'를 11월부터 한국 및 아시아 시장에 선보인다. PNMT는 지난 8월, 시스트란인터내셔널이 프랑스 및 유럽 시장에 먼저 선보인 바 있으며, 한국을 비롯해 아시아 지역의 주요 언어도 상용화 할 수 있을 수준의 학습을 마치고 국내 시장에도 진출했다.
PNMT는 인공신경망 기술을 적용한 기계번역 엔진이다. 인공신경망이란 인간의 뇌 구조를 컴퓨터 프로그램으로 구현한 기술로, 최근 인공지능 연구 분야로 주목받는 '딥 러닝'의 핵심이다. 기존의 자동번역(기계번역) 시장에서 주로 사용하는 기술은 단어나 어휘 목록을 기반으로 작동하는 규칙 기반 기계번역과 언어 조합 변수를 바탕으로 작동하는 통계 기반 기계번역이 주를 이루고 있는데, 두 가지 방식 모두 단순한 데이터베이스를 이용해 번역 작업을 한다.
이와 달리 인공신경망을 적용한 기계번역은 전체 문장이나 문단 단위로 번역문을 처리하고 문맥에 따라 번역 순서를 자유롭게 바꿔 가독성이 높은 문장으로 바꿔준다. 예를 들어 한국어와 영어는 어순이 다르기 때문에 단순한 번역 방식으로는 우리가 이해할 수 없는 문장으로 번역된다. 특히 인공신경망을 통한 학습이 가능하기 때문에 새로운 언어를 배우는 인간의 뇌처럼 번역 정확도도 높일 수 있다.
시스트란인터내셔널 루카스 지 대표는 "PNMT는 약 5만여 시간동안의 언어 모델 학습 작업을 통해 탄생한 결과물이다. 현재 미주 및 유럽 주요 고객사와의 베타 테스트를 통해 상용 제품을 납품하고 있으며, 아시아 주요 언어도 학습을 끝내, 이를 국내 시장에 선보이게 됐다. 향후 인공신경망 기반 기계번역을 바탕으로 전세계 번역 시장을 이끌고, 의사소통 장벽이 사라지도록 최선의 노력을 다하겠다"고 말했다.
시스트란은 PNMT를 통해 언어 장벽을 넘어 글로벌 시장 진출을 원하는 기업을 위해 다국어 지원 파트너가 될 것이라고 강조했고, 법률, 자동차, IT 및 관광 산업 분야 등 B2B 시장을 적극 공략할 계획이다. 현재 시점에서 출시할 번역 언어쌍은 32개다. 올해 말까지는 PNMT로 직접 번역할 수 있는 언어쌍을 80여개까지 확장할 계획이다.
직접 번역 외에도, 특정 언어를 영어로 변환해 다시 원하는 언어로 변환하는 피벗 방식을 적용하면 향후 약 2,000여 개의 번역에 인공신경망 기계번역을 적용할 수 있을 전망이다. 예를 들어 직접 번역이 상대적으로 어려운 아랍어-한국어 번역의 경우 아랍어를 PNMT를 적용해 영어로 번역하고, 이를 다시 PNMT를 적용해 한국어로 번역할 수 있다.
루카스 지 대표는 "시스트란은 세계 최초로 이룩했던 NMT 상용화에 만족하지 않고, 48년간 축적해온 자연어 처리와 번역기술을 기반으로 글로벌 시장에서 선두를 놓치지 않기 위해, 새로운 엔진 PNMT를 출시했다"며, "우리는 경쟁사보다 더 나은 번역 결과물이 아니라 인간보다 더 나은 번역 결과물을 내놓는 것이 목표"라고 말했다.
시스트란인터내셔널의 PNMT는 데모 사이트(https://demo- pnmt.systran.net/production#/translation)에서 체험할 수 있다.
글 / IT동아 이상우(lswoo@itdonga.com)