챗GPT로 촉발된 인공지능 경쟁··· 네이버·카카오의 전략과 행보는?
[IT동아 남시현 기자] 오픈AI의 챗GPT로 촉발된 AI(Artificial Intelligence, 이하 AI) 기술 경쟁이 들불처럼 확산하고 있다. 지난 8일, 마이크로소프트가 챗GPT보다 뛰어난 성능의 프로메테우스 모델을 적용한 새로운 AI기반의 빙(bing)·엣지 브라우저를 공개했다. 사티아 나델라(Satya Nadella) 마이크로소프트 CEO 겸 이사회 의장은 "검색의 새 패러다임이 시작됐고, 새로운 날이 밝았다”며, “AI는 가장 큰 범주인 검색을 시작으로 모든 소프트웨어 범주를 근본적으로 변화시킬 것"이라고 말했다.
AI 연구에서 선두를 지켜온 구글 역시 지난 6일(현지 시각) AI 챗봇 ‘바드(Bard)’를 공개하며 공개적으로 맞불을 놨다. 물론 성능 시연을 보이려 내놓은 대답이 오답으로 밝혀지며 주가가 7.7% 급락하는 등 난감한 상황이 연출되고는 있지만 표면적으로는 인공지능 대전이 시작되는 분위기다. 구글이 서둘러 바드를 공개한 이유는 오픈AI가 상업운전을 시작하면서 예상보다 많은 주목을 받기 때문이고, 또 오픈AI보다 기술 수준이 높은 기업들이 점유율 경쟁에서 뒤처질세라 대응에 나섰기 때문이다.
피 튀기는 글로벌 AI 경쟁, 우리나라는 ‘한글’이 방파제 역할
치열하게 경쟁하고 있는 글로벌 기업들과 다르게, 국내 기업들은 서두르지 않는 분위기다. 독자적인 한글 문화권 덕분이다. AI의 성능은 데이터 보유량인 매개변수로 결정되며 글로벌 기업들은 영문 데이터를 기본으로 한다. 반면 우리나라는 한글을 기반으로 하며, 영문과 한글의 자연어 처리와 비정형 데이터의 결이 다르기 때문에 고유한 생태계를 형성하고 있다. 좋게 말하자면 외국계 AI이 침투하기가 어려워 우리만의 AI 개발이 힘을 받는 상황이고, 나쁘게 말하자면 세계적인 추세와 동떨어진 독자적인 행보라 볼 수 있다.
다행히 국내 IT 기업은 물론 통신 기업들까지도 몇 년전부터 AI 개발에 힘을 쏟고 있다. 카카오브레인은 21년부터 한국어 초거대 AI 언어 모델인 ‘KoGPT’를 연구하고 있으며, 네이버도 최근 진행한 콘퍼런스콜에서 올해 상반기 안에 초거대 AI 기반의 검색 경험인 ‘서치(Search)GPT’를 선보인다고 밝혔다. SK텔레콤도 올해를 AI 컴퍼니 전환의 원년으로 삼고 기술 제휴를 통해 AI 서비스 에이닷(A.)을 고도화하겠다고 밝혔으며, KT와 유플러스 역시 초거대 AI ‘믿음’과 AI 통합 브랜드 ‘익시(ixi)’를 공개하며 시장 대응에 나서고 있다. 기업마다 추구하는 방향과 목표는 다르지만, 한글 기반 AI라는 공통점을 바탕으로 생태계가 커나가고 있다.
챗GPT의 6천500배 데이터··· 네이버의 초대규모 AI ‘하이퍼클로바’란?
현재 우리나라에서 가장 주목할만한 AI 프로젝트는 네이버의 ‘하이퍼클로바’다. 하이퍼클로바는 네이버가 자체 보유한 700페타플롭스 성능의 슈퍼컴퓨터와 네이버 생태계의 방대한 데이터를 조합한 초거대 AI로, 한국어 데이터 학습량이 챗GPT-3의 6천500배 수준이다. 특히 데이터 중 한국어 비중이 97%에 달해 한국어에 최적화된 모델을 만들 수 있고, AI 주권 확보 차원에서도 의의가 있다.
하이퍼클로바는 모두를 위한 AI라는 방향성을 모토로 실제 네이버 서비스 곳곳에 적용돼 있다. 챗GPT가 단순 채팅 서비스만 지원하는 것과 달리, 실용성과 상업성 모두 달성하고 있다. 대표적으로 네이버의 음성 기록 서비스인 클로바노트가 있으며, 노인 대상 서비스인 클로바 케어콜과 AI 기반 대화 기능인 똑똑사전 등이 있고, 네이버 쇼핑에서도 클로바 MD나 Ai 리뷰 요약, AI 추천메시지 등 다양한 방면에 하이퍼클로바가 도입됐다.
또한 작년 2월부터는 네이버 관계기업 500여 곳을 대상으로 하이퍼클로바 기반의 노 코드 개발 환경·프로그램인 클로바 스튜디오를 시연하고 있다. 개발자가 아닌 기획자나 마케터 등의 직군도 지시문과 예제 등을 제시해 코딩 작업을 수행할 수 있도록 도와주는 기능이다. 우주문방구는 자사 세계관의 공동창작 플랫폼 스토리네이션에 AI 보조 작가 ‘토리 AI’를 적용하는가 하면, 아스타컴퍼니는 AI 카피라이터 서비스 모카의 상품 언어, 광고 헤드라인, 세일즈 카피 생성에 클로바 스튜디오를 적용한 바 있다.
네이버 역시 올해 본격적으로 하이퍼클로바의 사용을 대중화할 예정이다. 네이버 최수연 대표는 지난 3일 진행된 4분기 실적발표 콘퍼런스에서 “네이버는 생성형 AI의 단점으로 꼽히는 최신성과 신뢰성 부족, 그리고 해외 업체들의 영어 기반 모델을 한국어로 옮기면서 발생하는 정확성 저하를 네이버의 풍부한 사용자 데이터와 기술 노하우로 대응할 것”이라면서, “올 상반기 내로 네이버만의 업그레이드된 검색 경험인 서치GPT를 선보일 예정”이라고 말했다.
이미지 기반의 개발에 방점두는 카카오브레인
네이버가 검색엔진 개선에 힘을 쏟고 있다면, 카카오는 데이터 가공 측면에서 접근하고 있다. 카카오는 2017년 2월, 자동화된 기계학습과 시각 데이터, 음성인식, 자연어 처리 등을 연구하기 위해 카카오브레인을 설립했다. 카카오브레인은 지난 21년 11월, 60억 개의 매개 변수와 2천억 개 토큰의 한국어 데이터를 바탕으로 하는 ‘KoGPT’를 선보인 바 있으며, 21년부터 순차적으로 AI 멀티 모달(Multi Modal, 언어·시각·청각 등 다양한 형태의 데이터를 복합적으로 이해하는 개념) 기반의 이미지 생성 모델인 ‘minDALL-E’와 ‘RQ-트랜스포머’, 그리고 이를 토대로 한 AI 아티스트 ‘칼로(Karlo)’까지 공개했다.
칼로는 1억 2천만 장 규모의 텍스트-이미지 데이터셋을 기반으로 문맥을 이해해 다양한 화풍과 스타일로 그림을 그리는 AI 서비스다. 사용자가 ‘a black rabbit in the style of an oil painting(유화로 그린 검은 토끼)’라는 제시어를 입력하면 ‘칼로’가 제시어의 맥락을 이해하고 검은 토끼의 이미지를 유화 화풍으로 상상하여 그려내는 식이며, 추가 명령어를 통해 이미지의 화풍과 세부 내역을 조정할 수 있다.
칼로는 지난 1월 애플리케이션 응용 프로그램과 체험판이 공개돼 본격적인 상업 사용이 시작됐으며, ‘B^ DISCOVER’ 플랫폼을 사용해 생성하고 공유할 수 있다. 이외에도 카카오브레인은 7억 4천만 개의 이미지-텍스트로 구성된 데이터셋 ‘코요(Coyo)’도 공개하는 등 기술 생태계 확장에 열을 올리고 있다.
AI의 목적은 데이터 수익화, 한국형 AI도 순항 중
마이크로소프트와 구글, 그리고 네이버와 카카오 등 국내외 IT 기업들이 AI 개발에 열을 올리고 있는 이유는 지금까지 확보한 데이터를 수익으로 전환할 수 있는 가장 좋은 방안이 AI라서다. 마이크로소프트의 빙에 적용된 프로메테우스가 수익화의 긍정적인 사례다.
업스테이지 AI 프로덕트 배재경 리더는 “새로운 빙 엔진은 질문의 패턴을 이해해 상위에 노출하는 사용자 경험, 그리고 광고로의 연결이 기대 이상이다. 기존 검색 광고 방식의 큰 틀이 바뀌는 것은 아니기에 구글이나 국내 검색 포털도 유사한 방식을 취할 것”이라면서, “구글이나 네이버 등 미리 준비하고 있던 기업들의 상황을 볼 때 산업 전반이 재편되기보다는 기존 업체들이 수익 구조를 고도화하는 방향으로 나아갈 것”이라고 전망했다.
결과적으로 마이크로소프트와 구글 간의 AI 경쟁이 챗GPT로 인해 시작된 건 맞지만, 이미 구글이나 메타 등의 기업들은 오래전부터 AI을 개발해왔다. 단지 수익화를 놓고 유예되어 온 경쟁이 챗GPT로 인해 시작됐을 뿐이다. 그러한 상황 속에서 국내 기업들은 한글 데이터를 방파제 삼아 독자적인 성장세를 이어나가고 있다. 언제든지 추세가 급진적으로 변할 수는 있지만, 우리 기업들 역시 글로벌 기업에 종속되지 않고 꾸준히 성장해 나가고 있다는 점은 긍정적이다.
글 / IT동아 남시현 (sh@itdonga.com)