데이터 주권 강조하는 소버린 AI, 진정한 의미는?

김예지 yj@itdonga.com

[IT동아 김예지 기자] 인공지능(AI) 기술은 국가 경쟁력 주요 자산의 지표다. 세계 AI 선점 경쟁이 치열한 가운데, 시장 파이 확보를 위한 국가 주도의 ‘소버린 AI(Sovereign AI)’가 등장했다. 소버린은 주권, 또는 자주권을 뜻한다.

소버린 AI는 국가가 자국의 데이터 및 인프라를 활용해 그 국가의 제도, 문화, 역사, 가치관을 이해하는 AI를 개발 및 운영한다는 개념이다. 이는 특정 국가의 AI 모델에 의존할 경우 기술 종속을 야기한다는 문제의식에 닿아 있다.

예컨대, 소수의 글로벌 빅테크 기업이 만든 AI 모델은 약 90% 이상을 미국 데이터로 학습했다. 이에 따라 특정 문화권에 편향된 답변을 제시하거나, 다른 문화권을 왜곡할 수 있다는 우려가 존재한다. 더불어 거대 언어 모델(LLM) 특성상 더 많은 사용자가 AI를 활용할수록 성능이 빠르게 향상돼 간극은 더욱 커진다.

그래서 소버린 AI의 핵심은 데이터 주권 확보에서 출발한다. 자국이 데이터를 독립적으로 통제 및 관리하고, 핵심 AI 기술을 독자적으로 개발 및 운영할 수 있는 인프라를 갖췄는지가 판단 기준이다. 이로써 국가 문화적 정체성 수호와 AI 기술 자립이 가능한지에 방점을 둔다.

소버린 AI 이미지 / 출처=네이버
소버린 AI 이미지 / 출처=네이버

네이버는 왜 소버린 AI를 강조할까

유럽 및 아시아권에서도 소버린 AI 개발을 준비 중이며, 국내에서는 네이버가 가장 분주한 행보를 보인다. 네이버는 2021년 세계 3번째로 자체 LLM 하이퍼클로바(HyperCLOVA)를 공개한 기업으로, 한국어 기반 초거대 AI 원천 기술, 클라우드 기술 등을 보유했다.

그러나 소수의 글로벌 빅테크 기업에 비해 네이버가 시장에서 확보한 파이는 크지 않다. 이러한 가운데, 네이버는 그들과 다른 시장 전략으로 소버린 AI를 선택한 셈이다. 이들 기업의 AI가 다양한 영역에서 시장을 독점하자, 네이버는 AI 기술 격차가 경제적·사회적 문제를 초래한다고 주장하며, 이를 좁히는 방안으로 소버린 AI 구축을 내세웠다.

네이버는 소버린 AI로 다양한 국가 및 기업이 참여하는 건전한 AI 생태계를 만들 수 있다는 관점을 제시한다. 다양한 주체 간 경쟁 및 공존이 기술 혁신을 가속함으로써 장기적으로 균형 잡힌 발전에 기여한다는 설명이다. 물론 여기에 국가별 문화 정체성을 보호할 수 있다는 설득력 있는 철학도 담았다.

한편, 일각에서는 소버린 AI가 주권 확보를 표방하지만, 쇄국 정책이 아니냐는 의문을 제기한다. 그러나 네이버가 주장하는 소버린 AI는 폐쇄성과는 거리가 멀다. 네이버 관계자는 “소버린 AI의 목표는 자국의 이익과 가치를 보호하는 것이지, 다른 AI를 배척하는 게 아니다”라고 설명했다.

그래서 네이버는 다른 AI 모델의 대체재가 아니라 또 하나의 선택지로서 소버린 AI 확보를 강조한다. 네이버 관계자는 “최근 네이버는 소버린 AI보다 ‘포용성’의 뜻을 가진 ‘인클루시브 AI’라는 단어를 사용하고 있다. 네이버의 소버린 AI 철학은 특정 문화권에 편향된 AI가 세계에서 통용되는 것보다 여러 문화권의 언어를 학습한 각각의 모델들이 공존하는 상태가 낫다는 관점에서 시작한다”고 말했다.

또한 “특정 데이터에 치우쳐 학습한 AI는 성능이 뛰어나더라도, 해당 문화권의 사용자가 아닐 경우 생산성 효과는 상대적으로 낮다. 이러한 관점에서 사용자는 소수의 모델뿐만 아니라 자국 언어 중심의 AI도 선택해 사용할 수 있어야 한다고 덧붙였다.

네이버는 소버린 AI 수출을 목표로 한다 / 출처=셔터스톡
네이버는 소버린 AI 수출을 목표로 한다 / 출처=셔터스톡

네이버, 맞춤형 소버린 AI 수출 전략 앞세운다

특히 네이버가 목표로 둔 시장은 분명하다. 네이버의 목표는 AI 개발 역량이 부족한 국가들에게 소버린 AI를 수출하고, 구축을 지원하는 것이다. 네이버 관계자는 “상당수의 선진국도 LLM 개발에 어려움을 겪고 있는데, AI 개발 풀스택을 보유한 네이버가 AI 개발 역량이 부족한 국가에 해결 방안을 줄 수 있다”고 말했다.

이는 글로벌 빅테크 기업과 전략 면에서 다른 지점이다. 네이버 관계자는 “이미 세계에서 범용적으로 쓰이는 성능 좋은 모델을 보유한 기업은 동남아, 중동 지역 등 국가별 소버린 AI 시장에는 뛰어들지 않는다”며, “네이버는 글로벌 빅테크 기업만큼의 기술력은 보유했지만 시장 규모는 이들 기업보다 작기 때문에 상대적으로 작은 시장에서 해당 국가의 데이터 및 인프라와 협력해 국가별 요구에 맞는 맞춤형 AI를 만들어줄 수 있다”고 말했다.

네이버의 소버린 AI는 글로벌 협력 전략과도 궤를 달리하지 않는다. 네이버 관계자는 “소버린 AI는 기술을 내재화하고 있는지에 중점을 두기 때문에 다른 기업과의 협력도 가능하다. 예컨대, 네이버는 하이퍼클로바X와 이를 기반으로 개발한 약 200여개 서비스가 있다. 이때 자체 기술만을 활용해 각 서비스에 AI를 접목하거나, 또는 다른 기업과의 협력으로 서비스를 운용할 수 있다”고 설명했다.

네이버는 AI를 국내 스타트업에게 오픈소스로 공개하면 AI 생태계를 활성화할 수 있다고 주장한다 / 출처=셔터스톡
네이버는 AI를 국내 스타트업에게 오픈소스로 공개하면 AI 생태계를 활성화할 수 있다고 주장한다 / 출처=셔터스톡

국내 기업에 오픈소스 공개…생태계 활성화 기대

결국 소버린 AI의 진정한 의미는 글로벌 기술 경쟁에서 독립성을 유지하기 위한 기술의 내재화로 정의된다. 더욱이 국가 안보, 행정 등 소버린 AI가 필수적인 부분에서 그 필요성은 커지고 있다. 그렇다면 앞으로 고민해야 하는 지점은 무엇일까. 우선 소버린 AI 구축을 위한 국가 및 지역별 AI 인프라, 데이터, 인력을 얼마나 확보할 수 있는지다. 대규모 투자 및 인재 양성뿐만 아니라 AI 생태계가 지속 활발해지기 위한 시스템 구축이 관건이다.

네이버는 소버린 AI 기업의 오픈소스 공개가 도움이 될 것이라고 주장한다. 네이버는 “정부 지원을 받은 기업은 자체 개발한 AI를 오픈소스로 공개한다. 또다른 국내 스타트업들은 이를 활용해 서비스를 개발 수정 및 배포한다. 이러한 과정을 거치면서 궁극적으로 AI 품질 향상 및 생태계 활성화를 기대할 수 있다”고 말했다.

나아가, 네이버는 AI 모델의 성능보다는 서비스로 연결될 수 있는 역할을 강조한다. 검색, 쇼핑, 지도 등 대표 서비스에 AI를 녹여 사용자 편의성을 높이고, 체류 시간을 늘리는 등 적극적으로 AI 접목을 넓혀갈 계획이다.

한편, 국가 주도 정책의 효과성은 지켜봐야 하는 문제다. 미국 47대 대통령으로 당선된 트럼프의 정책 기조는 AI 규제 대폭 완화, 민간 주도 AI 개발의 장려다. 지금은 소버린 AI를 강조하면서도 글로벌 빅테크 기업과 견주기 위한 AI 혁신 경쟁에도 사활을 걸어야 한다. 기술 격차를 좁히는 것을 넘어 우위를 차지하기 위한 전략을 고민할 때다.

IT동아 김예지 기자 (yj@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.