[2022 창구] 미리내테크놀로지스, "전 세계인을 위한 한국어 학습, 우리가 해낼 것"
[IT동아 남시현 기자] 내수 성장의 한계로 국내 기업들은 구글 플레이스토어 등의 앱 마켓을 통한 해외 진출에 관심을 기울이고 있다. 이에 중소벤처기업부와 창업진흥원, 구글은 국내 모바일 앱·게임 개발사의 성장과 해외 진출을 돕기 위해서 지난 2019년부터 ‘창구 프로그램’을 진행하고 있으며, 프로그램 운영사인 한국기술벤처재단이 이에 대한 운영을 맡고 있다. 창구 프로그램은 출범 이후로 올해 4회째를 맞이했다. 1~3기 창구 프로그램 참여 기업들의 연평균 매출 성장률은 85%였으며, 해외 진출은 70% 이상 늘었고, 이들은 2000억 원 이상의 추가 투자를 유치할 수 있었다. 이번 2022년 창구 프로그램은 80개 기업을 선정했으며, 사업화 자금을 최대 3억 원까지 지원했다. 참여 기업은 평균 1억 3500만 원을 지원받았으며 성장 및 해외 진출을 위한 세미나와 컨설팅, 네트워킹 혜택도 받았다. 취재진은 2022년 창구 프로그램에 선정된 80개 기업 중 10개 기업을 만나, 선정 기업이 창구 프로그램의 도움으로 성장한 이야기를 듣고 전하고자 한다.
2016년 이전의 기계번역은 단어와 구절을 나눈 후 사전적으로 번역하는 수준에 불과했다. 하지만 사람의 뇌 속 뉴런 작용을 본떠 만든 ‘인공신경망’ 기술을 번역 기술에 조합하면서 기계번역의 품질이 비약적으로 향상됐다. 현재 구글 번역, 파파고 등의 번역기는 단순히 단어나 문장을 해석하는 수준을 넘어서, 문맥을 인지해 다의어나 관용 어구까지 인식할 정도로 발달했다. 하지만 기술 전반이 영어나 프랑스어 등 라틴어 기반의 문자에 집중돼있다 보니 한국어의 번역 품질은 여전히 떨어지는 편이다.
다만 번역기 자체가 완전한 결과를 기대하는 도구가 아닌 만큼 실생활이나 문서 작성 등으로 번역기를 활용하는 데는 무리가 없다. 문제는 교육 용도로 쓰기엔 곤란하며, 특히 어순이 다른 외국인이 모국어를 한국어로 번역해서 학습하려는 경우에는 권장하기가 어렵다. 미리내테크놀로지스가 주목하고 있는 시장이 바로 이 한국어 학습 시장이다.
‘한글 정음 엔진, 오로지 미리내만 가진 기술’
미리내테크놀로지스는 외국인이 기계 번역 등을 활용해 한국어를 공부할 때, 자체 개발한 문장 분석 도구와 수준별 한국어 레슨, 질의응답 등을 통해 학습을 돕는다. 최근 K팝, K드라마 등을 통해 한국 문화를 접한 외국인들이 구글, 파파고 번역 등을 활용해 한국어 공부를 시작하는 경우가 많은데, 기존 번역기로는 파악하기 어려운 한국어 고유의 특징과 문장 구성까지 세세하게 짚어내 학습을 돕는다. 유환수 대표에게 미리내테크놀로지스의 기술력과 서비스 소개를 부탁했다.
유 대표는 “현재의 번역 기능은 기계학습과 자연어 처리를 합친 결과물이다. 이 방식은 라틴어 계열 간의 번역에는 문제가 없지만 문법과 규칙이 다른 한글과는 호환되지 않는다. 그래서 우리는 기계학습과 자연어 처리에 독자 개발한 한국어 컴파일러인 정음 언어 엔진까지 활용해 문장을 번역하는 걸 넘어 95%까지 분해한다”라며 소개를 시작했다. 한국어 컴파일러는 한글 문법을 구성하는 규칙을 다른 언어로 변환할 때 사용하는 도구로, 그 구성이 고도화할수록 규칙 기반으로 번역이 이뤄진다. 기존의 기계학습과 인공신경망은 번역돼있는 문장을 토대로 분석하는데, 컴파일러는 고유한 규칙을 기반으로 분석한다.
한국어 컴파일러 설계는 공동 창업자인 존 웨인라이트(John Wainwright)가 제작하고 있다. 존 웨인라이트는 컴퓨터 언어인 ‘스크립트X’와 ‘맥스스크립트’를 만든 컴퓨터 과학자로, 애플과 IBM의 합작사인 ‘칼레이다랩스’, 오토데스크의 수석 설계자를 거치는 등 실리콘밸리의 살아있는 역사로 통한다. 스티브 잡스에게 직접 기술을 팔았다거나, 아마존 CEO 제프 베조스가 시애틀에 그의 이름을 딴 빌딩을 지었을 정도다. 그러다 5년 전, 한국 문화에 처음으로 관심을 갖던 중 실리콘밸리에서 우연히 유 대표를 만나 친해졌고, 지금은 전 세계인이 한국어를 쉽게 공부할 수 있도록 미리내테크놀로지스에서 기술 개발에 전념하고 있다.
존 웨인라이트는 “현재 한국어 번역 기술은 가까운 단어 중 가능한 의미를 가져와 제공하는 수준이며, 내포된 뜻까지 설명하지 못한다. 학습자에게 필요한 문장의 통사적, 문법적 구조 등을 이해하기엔 부족하다. 미리내의 기술은 한국어에서 사용되는 600여 가지의 문장 패턴을 조합해 문장의 구문을 심층적, 생태학적으로 분석한다. 현재 업계에서 이 분석 방식은 유일하다”며 미리내테크놀로지스의 한글 정음 엔진에 대해 소개했다. 특히 컴퓨터 언어를 만들 수 있는 능력, 한국어를 학습하는 사람의 시각으로 만들다 보니 독보적일 수밖에 없다.
전 세계 211개 국, 60만 명이 사용··· 3,200만 명 시장이 목표
이렇게 개발된 미리내테크놀로지스의 교육 서비스는 작년 1월 시범 서비스를 시작해, 현재 211개국에서 60여만 명 정도의 사용자를 확보한 상태다. 언어는 영어, 일본어, 프랑스어, 아랍어 등 총 11개 언어를 지원하며, 한 사용자가 평균 25분 간 5개 정도의 세션으로 교육을 듣고 있다. 유 대표는 “한류 시장에서는 한국어 교육 시장 규모를 약 1억 5천만 명 정도로 파악하고 있으며, 이중 한국어 학습에 전념하는 수준을 3천200만 명으로 보고 있다. 우리의 기술이 파고드는 시장이 이 3천200만 명의 열성 사용자들이다”라면서, “지난 11월 15일 부분 유료화를 통해 시장성을 확인했고, 올해 안에 시장 전체 사용자 중 0.5%까지 확보하는 게 목표”라고 말했다.
경쟁 기업으로는 듀오링고(duolingo)가 있으며, 로제타스톤이나 한국어 학당 등과도 경쟁해야 한다. 하지만 미리내 서비스 특유의 한국어 분석 능력은 다른 서비스와는 결이 다르다. 실제로 기자가 미리내 서비스를 체험해봤는데, 한국어 문장에 담긴 중의어나 관용어, 심지어는 은유까지도 짚어낼 수 있는 수준을 보여주었다. 가령 ‘저는 한국어를 할 수 있어요’를 분석하면, 저는, 한국어, 를, 하ㄹ수있,어요로 나눈 뒤 각 문장의 주제문과 목적어, 동사 등을 따로 분석한 다음 문법 규칙까지 낱낱히 구분한다. 또 뜻 하나하나가 어떻게 변하는지, 어떤 의미를 담고 있는지까지 해석해낸다.
덕분에 K팝 가사나 영화 대사 등의 숨은 뜻까지도 파악하며 학습할 수 있고, 별도의 레슨과 라이브러리를 통해서도 심화학습을 들을 수 있다. 또한 기존의 교육 방식은 신조어가 반영되기까지 몇 년 이상 걸리지만, 미리내의 학습 방법은 곧바로 신조어를 반영하는 등 최신 트렌드에도 빠르게 대응할 수 있다. 웹 브라우저 기반은 물론 브라우저 확장 프로그램 방식까지 도입해 서비스를 제공하는 것도 접근성을 높이기 위한 전략이다.
창업진흥원의 2022 창구 프로그램, 해외 진출에 큰 도움돼
유 대표는 중소벤처기업부 산하 창업진흥원이 추진하고 있는 ‘2022 창구 프로그램’이 큰 도움이 된다고 말했다. 현재 일본어 가능 직원이 없어 일본 진출이 어려운 상황이지만, 창구 프로그램의 도움을 받아 일본 진출은 물론 투자까지 받아내고 있다. 유 대표는 “창구 프로그램은 기존에도 창업진흥원의 다양한 프로그램을 활용하고 있어서 접하게 됐다. 이번에 창구 프로그램에 선정되면서 해외 서비스 개발에 필요한 번역이나 마케팅까지 도움을 받고 있고, 또 구글 전문가를 통한 앱 최적화 컨설팅이나 투자자 유치를 위한 과정도 지원받게 된다”라고 말했다. 또한 “창구 프로그램 자체의 경쟁률이 치열한 만큼, 개발 능력뿐만 아니라 핵심성과지표나 마케팅 측면에서도 준비할 필요가 있다. 또 구글에서 긴밀히 협력해주는 만큼 자신이 만든 서비스를 알리고 싶다면 지원하는 것을 추천한다”고 답했다.
미리내테크놀로지스는 올해 2022 창구 프로그램 선정이라는 쾌거를 바탕으로, 내년 이후로는 더 큰 그림을 그리고 있다. 존 웨인라이트와 유환수 대표는 입을 맞춰 “단기적으로는 기술 기반의 품질을 높이는 데 주력할 것이고, K드라마나 K팝, K레시피 등 다양한 콘텐츠를 성공적으로 학습할 수 있는 작업을 병행할 것이다. 장기적으로는 더 많은 조합을 통해 개인 맞춤형 서비스는 물론 문화적인 부분까지 고려한 학습 서비스를 만들 것이다. 한국어의 숨은 매력을 전 세계인이 알 수 있도록 계속 엔진을 개발해나갈 것”이라고 말했다.
이들의 기술은 단순히 한국어를 쉽게 배우는 것 이상의 가치를 갖는다. 현재는 기계 번역을 대신할 한국어 학습에 초점을 맞추나, 더 큰 그림에서는 타 언어권과 한글이 어우러지는 결과까지 내다볼 수 있다. 유 대표는 “한글은 세종대왕이 만들고, 이를 현대화한 것은 호머 B. 헐버트다. 그다음 차례인 디지털화는 존 웨인라이트가 하고 있다. 우리의 도전이 대한민국 전체의 유산이 될 수 있도록 노력할 것”이라며 대화를 마쳤다.
글 / IT동아 남시현 (sh@itdonga.com)