포티투마루 “기업용 AI, 환각 줄이고 정확도 높이는 기술이 필수” [과기대X글로벌]
[서울과기대 x IT동아 공동기획] 글로벌 기업 협업 프로그램은 중소벤처기업부와 창업진흥원, 글로벌 기업 11곳이 7년 차 이내 유망 스타트업을 지원하는 사업입니다. 이중 서울과학기술대학교 창업지원단은 AWS 정글, 오라클 미라클, IBM 협업 프로그램을 주관합니다. IT동아가 서울과기대 창업지원단과 함께 올해 선정된 글로벌 기업 협업 프로그램 참여 기업을 조명합니다.
[IT동아 권택경 기자] 현재 인공지능(AI) 기술 경쟁은 대형언어모델(LLM) 중에서도 이른바 ‘최첨단 LLM(State-of-the-Art LLM)’을 보유한 글로벌 빅테크 기업이 주도하고 있다. 하지만 최첨단 LLM만 있으면 모든 게 능사는 아니다. LLM을 전문적인 산업 영역에서 활용하거나, 상용 서비스로 개발하기에는 아직 해결해야 할 문제도 많기 때문이다. 거짓말을 진실처럼 말하는 환각(Hallucination) 문제가 대표적이다.
최근에는 특정 전문 분야나 산업 영역에 특화한 모델이나 온디바이스(On-Device) 구동이나 비용 부담을 줄이기 위한 경량화 모델의 수요도 꾸준히 증가하고 있다.
결국 기존 LLM을 기반으로 도메인 특화 모델, 경량화 모델을 개발하고 이를 실제 효용성을 갖춘 상용 서비스로 만들어낼 수 있다면 스타트업에게도 AI 혁명 시대의 주역으로 올라설 기회는 얼마든지 있는 셈이다. 포티투마루(42MARU)와 같은 국내 AI 스타트업이 주목받는 이유다.
김동환 포티투마루 대표는 “GPT4가 변호사 시험, 회계사 시험, 의사 시험을 통과할 수 있는 수준이라고 하나 그 정확도는 80점 정도 수준”이라며 “아직 기업들이 실무에 활용하기엔 정확도가 낮고 환각 문제도 있다. 보안과 비용 문제도 도입 장벽이다”라고 말했다.
포티투마루는 이처럼 기존 범용 LLM의 한계를 보완하고 기업들이 실제 업무에서 활용할 수 있는 AI 솔루션을 만드는 역할을 한다. 김동환 대표는 “쉽게 말해 기업들이 실무에 쓸 수 있는 기업용 챗GPT 같은 서비스를 만든다”고 설명했다.
포티투마루에서는 기존 LLM의 한계를 보완하기 위해 기계독해(MRC, Machine Reading Comprehension)와 검색증강생성(RAG, Retrieval Augmented Generation)을 접목했다.
MRC는 주어진 문서를 읽고 질문에 답을 도출해 내는 기술이다. 답변할 수 있는 범위는 좁지만 그만큼 정확도는 높다. LLM의 단점을 보완하는 데 알맞은 기술인 셈이다.
마찬가지로 LLM의 단점을 보완하는 기술로 최근 주목받는 RAG 또한 LLM의 답변에 필요한 데이터를 검색해 답변 정확도를 높이는 역할을 한다. 일반적인 LLM이 답변을 도출하는 과정이 일반 시험이라면, RAG은 이를 오픈북 시험으로 만든다.
김동환 대표는 “경량 sLLM과 딥러닝 기반 AI 독해 솔루션인 ‘MRC42’, 검색 증강 생성 솔루션 ‘RAG42’ 등 각 기술을 요소 별로 솔루션화했고, 각 기술 요소마다 용도와 분야에 따라 특화된 모델을 확보하고 있다”면서 “어떤 기업이 어떤 문제를 해결하고 싶은지에 따라 각 요소를 레고 조립하듯 조합해서 최적의 AI 솔루션을 엔드투엔드로 제공할 수 있다”고 말했다.
김동환 대표는 국내 1세대 포털인 엠파스의 검색 엔진을 만들고, 네이트에서 검색 사업 본부장을 지내다 지난 2017년 포티투마루를 창업했다. 인간 뇌를 모방한 인공신경망을 활용한 딥러닝(Deep Learning)의 등장이 세상을 바꿀 것이란 생각에 이를 활용한 AI 기술 개발에 뛰어든 것이다.
챗GPT가 촉발한 LLM 열풍 이전부터 포티투마루는 AI 독해 분야에서 이미 그 기술력과 경쟁력을 세계적으로 인정받았다. 지난 2018년 미국 스탠퍼드 대학이 주관한 글로벌 기계독해 경진대회(SQuAD2.0)에서는 구글 AI 팀과 공동 1등을 차지하기도 했다. 김동환 대표는 “마이크로소프트, IBM, 메타 등 대기업과 스탠퍼드 대학, 카네기 멜론 대학 등 세계적 대학의 뛰어난 연구팀이 모두 참여하는 대회에서 1등을 차지했다는 건 글로벌 최고 수준이라는 것”이라고 말했다.
포티투마루는 사업 초기에는 주로 딥러닝 기반 AI 독해 솔루션을 기반으로 QA(Question Answering) 엔진을 개발해 국내 기업의 지식 검색 서비스, AI 고객센터(AICC)의 엔진 등을 공급해 왔다. 삼성, LG, 현대기아차, 하나은행, 신한생명 등 국내 주요 대기업 및 금융사들 대부분을 고객사로 두고 있다.
김동환 대표는 “지금의 AI 시장도 결국 큰 틀에서 보면 언어를 처리하는 검색 시장의 연장선”이라며 “99년 엠파스 시작 이후 20년이 넘는 시간 동안 검색 엔진을 개발하며 다양한 콘텐츠를 다루고 상용화한 경험이 포티투마루의 강점 중 하나”라고 말했다. 이어 “해외 스타트업 중에서도 우리처럼 많은 시행착오를 겪으며 상용화 경험과 노하우를 쌓은 곳은 드물다”고 덧붙였다.
이런 포티투마루에 눈독을 들이는 기업은 한둘이 아니다. LG유플러스는 포티투마루에 100억 원 규모 지분을 투자하며 AI 신사업의 파트너로 삼았다. 네이버클라우드도 포티투마루에 전략적 투자하며 네이버의 자체 LLM인 하이퍼클로바X의 고도화와 사업화를 함께 할 계획이다.
오라클 또한 스타트업 지원 사업인 ‘미라클 프로그램’을 통해 포티투마루에 힘을 실었다. 포티투마루는 미라클 프로그램을 통해 ‘NL2SQL’ 기술을 오라클 시스템에 접목한 서비스를 개발 중이다. NL2SQL은 자연어를 데이터베이스용 프로그래밍 언어인 SQL로 변환해 주는 기술이다. 챗봇이 간단한 코딩을 대신하듯 데이터베이스 관리와 활용을 별도 코딩 없이 챗봇과 대화로 해결하게 한다는 것이다.
포티투마루는 이 서비스를 활용하면 데이터베이스 관리자(DBA, Database Admin)와 같은 전문 인력 부재로 오라클의 데이터베이스나 클라우드 인프라 도입을 망설이던 기업들의 도입 장벽을 낮춰줄 것으로 기대한다.
김동환 대표는 “DBA는 한때 연봉이 수억 원 단위에, 시간당 수당을 지급해야 할 정도로 고급 인력이라 대기업 외에는 오라클을 도입하기 어려웠지만 NL2SQL을 활용하면 AI가 DBA, 데이터베이스 개발자, 데이터 사이언티스트들이 하는 역할을 대신할 수 있다”고 말했다.
포티투마루는 지금까지 확보한 기술과 노하우를 바탕으로 이제 본격적인 AI 시장 선점에 나선다는 계획이다. 국내 시장을 넘어 유럽을 시작으로 북미, 중동 등 글로벌 진출도 준비 중이다. 김동환 대표는 “AI 시장은 아직 초기 시장이다. 이 초기 시장을 선점해서 기업용 AI 솔루션 시장에서 주요 플레이어로 자리매김하는 게 목표”라고 말했다.
글 / IT동아 권택경 (tk@itdonga.com)