플리토, '초개인화' 실시간 통역으로 AI·데이터 시장 모두 잡는다

남시현 sh@itdonga.com

[IT동아 남시현 기자] 8월 28일, 언어 데이터 전문 기업 플리토(Flitto)가 창립 13주년을 맞아 첫 기자간담회를 개최하고 ‘플리토 2.0’ 비전과 초개인화 기술 현황을 선보였다. 플리토는 2012년 설립된 이래 집단지성 기반의 영어 번역 서비스 및 플랫폼 사업을 운영해 왔지만, GPT 등 대형언어모델(LLM)이 AI시장의 주요 관심사로 커지면서 언어 빅데이터 전문 기업, 실시간 번역 서비스 기업으로 사업 영역을 넓혔다.


이정수 플리토 대표가 플리토의 새로운 비전인 ‘플리토 2.0’을 소개 중이다 / 출처=IT동아
이정수 플리토 대표가 플리토의 새로운 비전인 ‘플리토 2.0’을 소개 중이다 / 출처=IT동아

이정수 플리토 대표는 “플리토가 기자간담회를 개최하는 건 13년 만의 일이다. 시간이 꽤 지났지만 플리토는 초창기의 꿈을 계속 실현해나가고 있으며, 지난 4월에 라이브 트랜스레이션(실시간 통역) 기능을 출시해 영문 번역의 새로운 장을 열었다. 덕분에 창업 12년 만에 사업이 성장궤도로 올라섰다"라고 말했다.

이어서 "AWS, 애플, 구글 등 글로벌 빅테크 기업들이 우리 서비스를 이용하며, IT를 넘어서 의료, 금융, 교육, 문화 등에서도 쓰인다. 콘퍼런스를 넘어 직무 교육이나 강의, 유튜브 등 음성 및 영상 콘텐츠 전반으로 통역 서비스가 확장되는 추세”라며 발표를 시작했다.

플리토 성장의 핵심 동력, 라이브 트랜스레이션과 초개인화

라이브 트랜스레이션은 화자가 말하는 내용을 실시간으로 통역하는 기능이다. 입력 후 처리 시간이 걸리는 일반 번역과 달리 약간의 시간차만 두고 즉시 내용을 번역한다. AI 성능이 향상되고 있는 지금으로서는 어떤 기업이든 금방 구현할 수 있다. 하지만 빠르게 처리하는 것보다 중요한 것이 정확성이다.


편의성, 확장성, 비용 효율, 신뢰성은 어떤 기업이든 쉽게 확보할 수 있지만, 맞춤형과 정확성은 기술의 영역이라고 말했다 / 출처=IT동아
편의성, 확장성, 비용 효율, 신뢰성은 어떤 기업이든 쉽게 확보할 수 있지만, 맞춤형과 정확성은 기술의 영역이라고 말했다 / 출처=IT동아

이정수 대표는 “편의성, 확장성, 비용 효율, 신뢰성은 시중의 기술로도 충분히 구현할 수 있다. 하지만 맞춤형 결과와 정확성 부분까지 가져가긴 매우 어렵다. 예를 들어 기업의 연사자 이름이나 고유명사 등은 번역 기술만으로는 정확하게 만들기 어렵다. 이정수라고 해도 이종수라고 받아 적는 식이다. 이것을 정확히 하려면 관련된 기술이나 내용 등을 사전에 학습한 뒤, 청자가 누구인지 고려를 해서 번역이 이뤄져야 한다”라고 설명했다.

이 부분을 관통하는 키워드가 초개인화다. 플리토의 초개인화는 번역을 사용할수록 개인이 말하는 특정맥락과 어조, 대화 방식에 맞춰는 실시간 번역과 교정 결과를 제공하는 기술이다. 기존의 번역 기술은 고유명사나 흐린 발음 등을 제대로 인식하지 못했는데, 특정 데이터를 사전에 학습하는 식으로 내용을 정확하게 교정한다.

이정수 대표는 “기업용 서비스는 현재 초개인화가 적용돼 있다. 예를 들어 의료 분야만 해도 어려운 전문 용어나 사람마다 발음 등이 모두 다 다르다. 초개인화를 통해 사전에 논문이나 관련 자료 등을 사전에 입력하고 학습시키면 어려운 내용도 논문에 있는 그대로 전달한다”라고 설명했다.


즉석에서 기자 개인 링크드인 링크를 넣고 번역 시 필요한 고유명사 등의 데이터를 추출하는 모습을 보여줬다 / 출처=IT동아
즉석에서 기자 개인 링크드인 링크를 넣고 번역 시 필요한 고유명사 등의 데이터를 추출하는 모습을 보여줬다 / 출처=IT동아

이정수 대표는 초개인화를 설명하기 위해 기자의 인적사항에서 데이터를 추출해 보였다. 플랫폼 내에 해당 인사의 SNS나 기사, 논문, 주요 분야 등등을 찾아 입력하면 플리토 플랫폼 상에서 자동으로 데이터셋을 생성하고 키워드를 추출한다. 이를 바탕으로 다른 언어에 대입하는 용어를 판단하고 고유명사 등을 확인하면 해당 대상에 최적화된 번역 환경이 완성된다. 실제로 라이브 트랜스레이션이 기자의 이름을 Si-hyun으로 기재했다가 데이터셋으로 학습된 이름을 보고 Si Hyeon으로 교정하는 등의 내용도 볼 수 있었다. 전문 영역일수록 해당 기능이 번역의 완성도를 높일 수 있다.

데이터 확보는 1400만 명이 활동하는 플리토의 번역 커뮤니티를 활용한다. 이정수 대표는 “메타의 대형언어모델 Llama를 놓고 사람마다 말하는 발음이 다 다르다. 누구는 엘엘에이엠에이, 엘라마 라고 할 수 있다. AI는 이런 부분을 이해하지 못한다. 그래서 커뮤니티를 통해 작은 보상을 걸고 Llama에 대한 간단한 발음 테스트를 맡긴다. 이런 내용을 통해 다양한 발음과 악센트를 훈련하고, 서비스의 정확도를 높인다”라고 말했다.


플리토는 2024년 라이브 트랜스레이션 출시 이후 국내는 물론 해외에도 설루션을 공급 중이다 / 출처=IT동아
플리토는 2024년 라이브 트랜스레이션 출시 이후 국내는 물론 해외에도 설루션을 공급 중이다 / 출처=IT동아

이정수 대표는 초개인화의 목표는 기업 시장을 넘어서 개인 시장이라고 말했다. 이정수 대표는 “해당 기능은 궁극적으로 개인 시장을 향한다. 언어가 서로 다른 두 사람이 대화할 때 라이브 트랜스레이션의 초개인화 기능을 활용하면, 엔진 내에서 자동으로 각자의 학습 데이터를 공유해 대화의 정확도를 높인다. 일단은 기업 환경에 대응하지만 장기적으로는 서비스형 소프트웨어(SaaS) 형태로 개인 용도로도 제공할 생각”이라고 답했다.

국립국어원과 협력, 독자 AI 파운데이션 사업에도 참여

AI 시장 쪽으로의 가능성도 계속 확장하고 있다. 플리토는 유일하게 5년째 국립국어원 말뭉치 구축 사업에 참여 중이며, 최근 국내 AI 반도체 기업 퓨리오사AI와도 양해각서를 체결하고 추론 작업에서 GPU를 대체하기 위한 연구에도 나섰다. 독자 AI 파운데이션 구축 사업도 업스테이지 컨소시엄으로 참여한다.

이정수 대표는 “국립국어원에서 원하는 데이터 정제 정확도는 99.9%다. 그런데 데이터 정제에 필요한 언어가 크메르어, 타갈로그어 같은 어렵고 소수만 쓰는 용어들이다. 이를 위해 플리토는 인간 피드백 기반 강화학습(RLHF)과 사고 사슬(CoT) 등을 동원해 데이터를 고도화하며, TTA 데이터품질인증도 취득했다”라면서, “이런 노력 덕분에 플리토의 데이터 매출의 75%는 해외로 나가고, 매출 규모도 미국과 일본 순서로 큰 상황”이라고 정리했다.


백준호 퓨리오사AI 대표(좌)와 이정수 플리토 대표(우)가 AI 기술 공동 연구를 위한 양해각서를 체결했다 / 출처=플리토
백준호 퓨리오사AI 대표(좌)와 이정수 플리토 대표(우)가 AI 기술 공동 연구를 위한 양해각서를 체결했다 / 출처=플리토

한국형 AI를 만드는 독자 AI 파운데이션 구축 사업에는 업스테이지의 컨소시엄으로 참여한다. 이정수 대표는 “업스테이지와는 긴밀한 관계다. 김성훈 업스테이지 대표는 데이터의 중요성을 늘 피력해 왔고 2024년 양해각서 체결 시점부터 언어 데이터 등을 구매한 바 있다. 독자 AI 파운데이션 구축도 같은 맥락으로 참여했고, 다른 대기업에는 없는 스타트업만의 역량을 보여주자며 의기투합한 상황”이라고 설명했다.

이어서 “퓨리오사AI와 협력에 나선 부분은 GPU 추론을 NPU로 대체하기 위한 연구다. 특히 보안 작업을 위해 자체 서버에서 플리토 서비스를 운용하려는 글로벌 기업들도 있는데, 이 경우에 GPU보다 NPU를 활용할 수 있는 방안을 모색하고 있다”라면서, “현재 작업은 텍스트 쪽만 하고 있고, 장기적으로 비전인식 등을 포함한 더 많은 기능에서 엔비디아 GPU를 대체할 수 있는지 확인하고 협업해 나갈 예정”이라고 답했다.

창립 13년 차 맞은 플리토, 새로운 방향으로 나아갈 때

플리토의 다음 행보는 ‘플리토 2.0’이다. 이정수 대표는 “가장 고품질의 언어 데이터를 갖고 있다고 자부할 수 있다. 그럼에도 다음 목표는 데이터 자산을 더 고도화하고 품질을 더 끌어올리는 것이다. 그리고 이제 플리토 1.0을 지나서 2.0이라는 새로운 목표로 비상할 때다. 앞으로 더 많은 글로벌 뉴스와 성장에 관련된 소식들을 제공할 수 있을 것”이라는 뜻을 밝혔다.


좌측부터 신기영 최고전략책임자, 김진구 최고데이터책임자, 이정수 최고경영자, 강동한 최고기술책임자, 윤민용 최고재무책임자 / 출처=IT동아
좌측부터 신기영 최고전략책임자, 김진구 최고데이터책임자, 이정수 최고경영자, 강동한 최고기술책임자, 윤민용 최고재무책임자 / 출처=IT동아

이정수 플리토 대표는 2024년 본지와 진행한 인터뷰에서 “언어 장벽이 없는 세상을 만들자는 플리토의 미션은 변하지 않는다. 그 과정에서 매출을 늘리고, 주주의 이익을 극대화하는 것도 포함이다. 이를 실현하기 위해서는 플랫폼을 고도화해 참여율을 높이고, 데이터의 품질을 높여야 한다”라는 다짐을 밝힌 바 있으며, 이번 기자간담회에서 그 목표를 더욱 명확히 볼 수 있었다.

스타트업으로 시작해 기술특례상장 1호 기업이라는 부담이 내내 플리토에게 부담으로 다가왔을 것이다. 하지만 AI 시장의 성장 덕분에 플리토 역시 가파른 성장세에 진입했다. 플리토는 올해 3월 글로벌 빅테크 기업과 836만 달러(약 113억 원대) 규모의 언어 빅데이터 공급 계약을 체결했고, 7월에도 471만 달러(약 64억 원) 규모의 AI 기반 언어모델 연구 및 개발용 데이터 공급 계약을 체결했다. 이를 바탕으로 현재 3분기 연속 흑자 행진을 기록 중이다. 이제 플리토는 번역 플랫폼 기업에서 언어 빅데이터 기업으로 더 넓은 길을 걷기 시작했다.

IT동아 남시현 기자 (sh@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.