[스케일업] 클리카 [2] AI 모델 최적화를 위한 여정, 클리카의 '딥러닝 연구원' 이야기
[IT동아 x SBA] IT동아는 서울경제진흥원(SBA)과 함께 ‘2024년 스케일업 프로그램’을 진행합니다. 서울창업허브 오픈이노베이션 참여기업 중 유망한 스타트업을 선정, 인터뷰로 발전사와 성과를 소개합니다. 나아가 이들이 다음 단계로 도약하도록 지원하는 프로그램입니다.
[IT동아 남시현 기자] 인공지능(Artificial Intelligence, 이하 AI)은 사전에 수집한 데이터를 패턴으로 정리하고, 이를 활용해 특정 동작을 수행하도록 만든 구성 요소다. AI가 적용된 서비스는 각자의 역할에 맞는 모델이 탑재되며, 데이터와 완성도, 동작 방식 등이 모델 성능을 결정한다. 하지만 대다수 AI 모델은 오픈소스를 기반으로 만들어지고, AI 개발자가 적용 환경을 고려해 최적화한다. 처음부터 적용 환경에 맞춰 완성도와 성능이 높지만, 시간이나 비용이 상당하다.
그러다 보면 적용할 장치보다 오픈소스 모델의 크기가 커서, 성능 향상을 위해 추가로 모델을 함축해야 하는 경우가 생긴다. 경우에 따라서는 모델의 성능은 유지하되 용량은 줄이고, 이를 통해 확보한 공간에 추가로 모델을 넣기도 한다. 이 과정에서 인공신경망 구조를 집약하는 게 AI 모델 압축의 개요다. 클리카는 기존에 AI 모델 개발자가 수작업으로 압축하는 이 과정을 자동화하는 자체 AI 엔진과 서비스를 개발 중이다.
콜빈 포카트(Corbin Foucart) 클리카 딥러닝 연구원을 만나 딥러닝 연구원의 역할과 사명, 그리고 클리카의 구체적인 기술력에 대해 들어보는 시간을 가졌다.
수많은 분야의 딥러닝 연구, 클리카의 사례에 집중
사실 딥러닝이라는 분야 자체는 AI 전역에 쓰인다. 따라서 딥러닝 개발자, 연구원이라는 직함을 가졌어도 회사나 분야, 업무에 따라 그 역할과 역량은 모두 다르다. 따라서 이번 스타트업인에서는 콜빈 포카트와 클리카의 딥러닝 연구원에 한정 지어 인터뷰를 진행했다. 먼저 콜빈 포카트 연구원 본인이 어떤 사람인지를 질문했다.
콜빈 포카트는 “스탠퍼드 대학에서 공학물리학 (Engineering Physics) 학사를 취득했고, 이후 매사추세츠 공과대학(MIT)에서 컴퓨터공학 (computational science and engineering) 석박사를 취득했다. 석박사 과정에서는 구체적으로는 계산물리학 (Computational Physics) 분야에 특화하였는데, 당시 이 분야에서 기계학습은 매우 초기단계로 적용사례가 많지 않았다. 연구 과정에서 기계학습 중 한 방법인 강화학습 (reinforcement learning)이 대규모 유체 시뮬레이션을 가속화시킬 수 있다는 부분에 크게 흥미를 느끼게 되었고, AI가 기존 학문의 제약사항을 무너뜨리는 점에 감명을 받아 AI 업계로 나섰다”라고 소개했다.
MIT 컴퓨터공학부에서 응용수학과 계산과학을 주 연구 분야로 박사 학위를 취득했다면 정말 많은 분야로 나아갈 수 있을 텐데, AI 산업으로 뛰어든 이유는 무엇일까? 콜빈 포카트는 “지금은 AI 르네상스다. 컴퓨터 자원은 계속 발전하고, 모델과 데이터의 규모는 커져간다. 이를 통해 사람들은 새로운 일을 하게 되고, 기존의 산업군도 발전과 혁신을 창출한다. 이 업계에서 내가 할 수 있는 역할이 있을 것이라 판단했다”라고 말했다.
광활한 AI 산업 중에서 특별히 모델 압축 분야를 선택한 이유에 대해 재차 질문했다. 이에 대해 "물리학 시뮬레이션은 한번 실행할 때마다 비용이 많이 든다. 그래서 내가 개발한 인공지능 모델과 시뮬레이션 소프트웨어를 실행할 때마다 성능을 최대치로 끌어올릴 수 있도록 고안해야 했는데, 이 점이 요즘 인공지능 모델 경량화 과정과 닮았다고 생각했다. 그래서 일상생활의 장치들에 비효율적인 모델을 압축해서 일상적으로 쓰이도록 만드는 과정을 매력적으로 느꼈다”라고 말했다.
이어서 “또 지금은 소수의 기업들이 AI 시장을 이끄는데, 이것이 특정 분야에 집중되지 않고 민주화되어야 한다 생각한다. 모델 압축을 통해 가능성을 만들고, 기술을 구현해 세상을 바꾸는 두 가지 조합이 모델 압축을 선택한 이유”라고 답했다.
개발과 연구는 다른 분야··· 이론과 실무 실현 가능성 찾는다
클리카는 AI 모델 압축을 자동으로 처리하는 엔진, ‘에이스’를 개발 중이다. AI 모델을 압축하는 이유는 기존의 컴퓨팅 성능은 유지하면서 AI 성능을 더 끌어올리고, 유지 및 도입 비용도 절감할 수 있어서다. 일반적으로는 AI 모델 컴프레션 개발자가 직접 진행하지만, 클리카 에이스는 자동화 알고리즘으로 모델을 최대 95% 압축하고, 속도는 4배에서 25배까지 가속한다. 운영 비용도 최대 80%까지 절감한다.
딥러닝 연구원으로서 어떤 영역을 맡고 있을까. 콜빈 포카트는 “AI 모델 압축은 이론적으로 가능해도, 실질적으로는 어려운 경우가 많다. 그래서 압축이 가능해도 특정 모델에 집중해서 특정 부분만 경량화할지 등을 정해야 한다”라면서, “연구 영역은 수학적으로 가능성이 있는지, 그리고 효율적인지를 기준으로 시작하며, 작업의 실현 가능성을 조사한 뒤 구현 단계를 연구한다. 주제는 이론과 실무 가능성을 반반씩 보고 결정한다”라고 말했다. 이때 연구하는 영역은 비전인식, 오디오, LLM, 생성형 AI 등 기계학습을 활용하는 영역 전체가 대상이다.
기술과 인력, 자금이 필요한 작업을 자동화했다는 점은 이해가 필요하다. 최대한 단순히 정리해 달라고 부탁했다. 콜빈 포카트는 “AI 모델은 부동소수점을 처리하며 작동하는데, 모든 과정에 무한대에 가까운 단위 계산이 필요하진 않고 정해진 범위 내에서만 계산해도 된다. 이런 부분을 효율적으로 만드는 게 클리카 에이스”라면서, “셰프가 12가지의 코스 요리를 준비했다고 치자. 그런데 손님이 햄버거만 먹으면 된다고 하면 셰프가 굳이 요리를 다 할 필요도 없고, 재료도 아낄 수 있다. 처리 방식을 간단히 표현하면 이렇다”라고 말했다.
콜빈 포카트는 “크고 비효율적인 모델을 에이스에 넣으면 작고 효율적인 모델로 전환된다. 이 과정을 세세하게 설명할 순 없지만, 투입 전 모델과 결과물을 상호 비교하는 식으로 전환 방식을 투명하게 증명할 순 있다”는 점도 덧붙였다.
딥러닝 연구원 되기 위해서 필요한 지식은 ‘수학’
딥러닝 연구원의 길을 걷기 위해 가장 필요한 지식을 물었을 때, 그는 ‘수학’이라고 말했다. 콜빈 포카트는 “딥러닝, AI 연구 등에서는 다양한 갈래가 있는데, 내 경험에 비춰보면 가장 중요한 것은 수학이다. 수학은 다양한 분야에서 혁신적인 해결책을 제시할 방안이다. 또 기계학습 연구 자체가 가능성의 영역이고 확률을 믿고 시도하는 경향이 있는데, 진정한 혁신은 수학적으로 접근했을 때 온다”라면서, “수학으로 가능성을 증명하고, 이를 시험하는 과정에서 결과가 나온다. 이런 태도를 갖춰야 딥러닝 연구의 길을 걷을 수 있다”라고 조언했다.
콜빈 포카트는 한국의 스타트업에서 일하고 있는 것 자체를 적시적소(Right Place, Right Time)라고 말한다. 그는 미국에서 할 수 있는 것과 아시아에서 할 수 있는 일이 다르고, 그중에서도 한국은 AI 분야에서 빠르게 성장하고 혁신을 이뤄내고 있다. 그러면서도 수평적인 기업 문화를 바탕으로 자유롭게 공유하고, 과학적인 접근 방법으로 문제를 해결하고 완성하는 클리카만의 기업 문화가 자신을 이 자리에 있게 하는 바탕이라 말한다.
마지막으로 콜빈 포카트는 “나는 해결하고자 하는 과제 자체가 흥미로우면 그것으로 만족하는 사람이다. 그래서 개인적인 목표보다는 회사 차원에서 AI 생태계에 기여할 수 있는 부분에 집중한다. 이번달에 클리카 베가, 다음 달에 모델버스라는 새로운 서비스가 시작된다. 이 서비스가 AI 시장에서 일으키는 반향과 결과, 그리고 그 과정에서 필요한 연구를 진행하는 것이 내 역할”이라고 말했다.
글 / IT동아 남시현 (sh@itdonga.com)