공공 AI의 주축으로 떠오른 '소버린 AI', 해외 주요 국가 동향은
[IT동아 남시현 기자]
“챗GPT가 있는데 소버린 AI를 왜 개발하냐, 낭비다라는 말은 베트남이 쌀을 많이 생산하는데 뭘 농사를 짓냐, 사 먹으면 되지 이런 얘기랑 똑같습니다. 그게 얼마나 위험한 생각인지 모르는 거죠”
지난 20일 울산전시컨벤션센터에서 열린 ‘울산 AI 데이터센터 출범식’에서 이재명 대통령이 한 말이다. 여기서 소버린 AI는 자주적인, 주권이 있는 이라는 뜻의 소버린(Sovereign)에 인공지능을 뜻하는 AI를 붙인 단어로, 한 국가 내에서 독립적으로 주권을 갖고 구축한 AI를 의미한다. 이미 글로벌에서는 오픈AI의 챗GPT나 구글 제미나이, 퍼플렉시티 등이 경쟁 중이고 중국 역시 딥시크, 마누스 등 걸출한 AI가 점유율을 높여가고 있다. 소버린 AI를 만들겠다는 말은 이런 상황에서 다른 국가에 종속되지 않고 독자적인 AI를 구축하자는 의미다.
이재명 대통령은 후보 시절부터 AI에 100조 원을 투자해 AI 세계 3대 강국으로 거듭나겠다며, 전 국민이 활용하는 한국형 챗GPT를 개발하겠다는 공약을 내놓기도 했다. 일각에서는 구체적인 계획없이 예산을 투자한다는 우려가 나오지만 해외에서도 이미 예산부터 투입하는 식의 소버린 AI 투자가 대세다. 전 세계 각국의 소버린 AI 개발 현황과 흐름에 대해 전반적으로 짚어봤다.
소버린 AI, 인재와 인프라, 제도 모두 확보해야
소버린 AI가 중요한 이유는 AI의 산업적 가치와 영향력이 높아질수록 무기화될 가능성도 커지기 때문이다. 지난 4월 카림 칸(Karim A. A. Khan) 국제형사재판소 수석검사가 베냐민 네타냐후 이스라엘 총리에게 체포영장을 발부하자 도널드 트럼프 미 대통령이 칸 수석검사의 업무용 마이크로소프트 이메일을 차단했다.
이로 인해 국제형사재판소의 업무가 일시적으로 마비됐고, 미국 정부가 특정 기관이나 개인에게 기술적 압력을 가할 수 있음이 알려져 파문이 일었다. 현재 국제형사재판소는 업무 시스템 일부를 유럽산으로 교체했고, 유럽 내 기업 및 기관에서도 미국산 대신 유럽산 소프트웨어 사용이 늘고 있다. 소버린 AI 없이 타 국가의 AI를 업무 전반에 도입한다면, 이메일 차단보다 훨씬 더 치명적이고 파괴적인 결과로 이어질 수 있다.
AI를 구축하기 위해 필요한 것은 크게 ▲컴퓨팅 인프라 ▲ 인재 개발 ▲ 제도적 기반이다. 생성형AI 모델을 개발하기 위해서는 모델을 훈련시키기 위한 GPU(그래픽 처리 장치), 그리고 전력 자원이 필요하다. 쉽게 말해 AI 모델을 개발하고 구동하기 위한 데이터센터와 전력 발전소가 필요하다. 그리고 소버린AI를 만들 수 있는 지식과 생태계, AI 교육 등을 받은 전문 인력들도 필요하다. 또한 AI 개발을 위한 데이터 확보나 개인정보 보호, 국가적 차원의 자금 지원 등 법적, 제도적 뒷받침이 필요하다.
국가별 통합 중시하면서도 개별 프로젝트 진행하는 유럽연합
유럽연합은 27개 국가로 구성된 정치 및 경제 공동체며, 24개의 공식 언어가 사용된다. 제조업 중심의 경제 구조로 인해 디지털 전환이 느렸지만 AI 시대에는 과감한 투자와 법제화를 통해 주도권을 확보하려 한다. 2018년에는 GDPR(일반정보보호 규정)을 통해 개인정보 보호의 큰 틀을 짰고, 지난해에는 인공지능법(EU AI Act)을 발효해 AI 개발과 인간의 존엄성 등의 균형을 잡고 있다. 흥미롭게도 소버린 AI 구축에 필요한 데이터와 인프라는 공유하면서, AI 자체는 각자 행동으로 나서는 모양이다.
앞서 가이아-X 등 통합 AI 구축에 대한 움직임이 있었으나 지지부진한 가운데, 올해 2월에 2000억 유로(약 317조 8500억 원)의 투자를 동원하는 ‘인베스트 AI 이니셔티브’가 새로 발표됐다. 유럽연합은 인베스트 AI를 통해 4개의 AI 기가팩토리를 유럽 각지에 설립하고, 생성 AI 개발과 교육, 훈련 등의 인력 양성에 나선다. 또 EU 14개 산업 생태계와 공공 부문에서 활용할 수 있는 ‘GenAI4EU’ 이니셔티브를 발족해 공동 활용할 수 있는 AI 개발에 나선다.
한편 프랑스의 에마뉘엘 마크롱 대통령은 기술 콘퍼런스 ‘비바테크’에서 소버린 AI 인프라 구축을 ‘주권을 위한 우리의 투쟁’으로 지칭했고, 같은 행사에서 프랑스의 AI 스타트업 미스트랄이 엔비디아와 협력해 1만 8000개의 GPU를 도입하기로 했다. 프리드리히 메르츠 독일 총리 역시 엔비디아와 도이체 텔레콤이 2027년까지 GPU 10만 개를 도입하는 것을 놓고 디지털 주권에 대한 ‘중요한 단계’에 있다 말하며 지원을 시사했다. 두 국가 모두 구체적인 소버린 AI 구축에 대한 그림은 부족하나, AI 개발에 필요한 자산 확보에 무게를 두고 있다.
영국은 올해 1월 ‘AI 기회 실행 계획’을 통해 50가지 권고안을 마련하고, 20억 파운드(약 3조 7000억 원)를 투자하는 등 구체적인 행동에 나선다. 영국 정부는 국가 컴퓨팅 역량 구축에 10억 파운드(1조 8550억 원)를 배정하고, 2030년까지 컴퓨팅 용량을 20배 확대한다. 5억 파운드(약 9277억 원)는 새로 신설된 소버린 AI 유닛 부서에 배정되고 영국 비즈니스 뱅크와 협력해 AI 성장 구역 조성에 나선다. 또한 영국 전역의 과학자들이 활용할 수 있도록 약 7억 5000만 파운드(1조 39000억 원)를 투자해 에든버러 대학에 슈퍼컴퓨터를 설치한다.
또 튜링 AI 글로벌 펠로우십으로 글로벌 AI 인재를 영국으로 초빙하고, 1억 8700만 파운드 규모의 테크 퍼스트 프로그램을 통해 학교 및 사회에 기술분야 인재 양성에 나선다. 정부는 2억 4000만 파운드를 AI 보안 연구소에 배정해 관련 법안 구축에 나서고, 영국 내 주요 대기업이 참여하는 영국 소버린 AI 산업 포럼을 설립했다.
아시아 역시 국가 주도의 소버린 AI에 무게
일본은 생성형 AI가 정체된 디지털 전환을 가속화할 도구로 보고 투자 중이다. 일본 정부는 지난해부터 올해까지 소프트뱅크에 474억 엔(약 4460억 원)을 투자해 일본어 모델 기반의 소버린 AI 모델을 구축 중이며, 자체 구축한 후가쿠(Fugaku) 슈퍼컴퓨터로 AI 모델을 만들고 있다. 제도적 측면에서는 ‘인공지능 관련 기술의 연구·개발 및 활용 촉진에 관한 법률안’을 마련해 AI 개발 시 발생할 수 있는 개인정보 유출, 허위정보 등의 비형사적 견제 장치를 마련했고, AI 전략팀을 신설해 일본 내 AI 경쟁력 강화와 기본정책 수립에 나선다.
중국은 2017년 ‘메이드 인 차이나 2025’ 이니셔티브를 통해 AI 개발에 대한 장기 전략을 수립했다. 현재 중국은 전 세계 상위 AI 연구자의 47%와 AI 특허 50%를 독식했으며, 14억 명 인구를 바탕으로 한 막대한 데이터와 전 세계의 원전 수를 합친 것보다 더 많은 원전 발전소를 건설해 데이터센터 부양에 나선다. 덕분에 딥시크 R1 등 미국발 AI에 견줄만한 독자적인 AI 모델들이 등장하고 있다.
인도 정부는 지난해 ‘인디아AI’를 발표하고, 소버린AI를 국가적 사명으로 설정했다. 인도 정부는 인디아AI 독립사업부를 구축하고 1조 371억 9200만 루피(16조 5300억 원)를 투입해 정부 및 민관 전반에 걸친 포괄적인 AI 생태계 구축에 나선다. 독립사업부는 1만 개 이상의 GPU로 구성된 공공 AI 컴퓨팅 인프라 구축, 대형언어모델(LLM) 및 파운데이션 모델을 개발하는 인디아AI 혁신센터, 박사 과정까지 AI 교육을 제공하는 인디아 AI 퓨처스킬스, 정부 및 기관 내 문제 해결을 위한 인디아AI 애플리케이션 개발 이니셔티브 등을 발족한다.
동남아시아는 싱가포르 정부 주도로 태국, 베트남, 인도네시아 등이 연합하는 ‘씨라이언 AI’를 개발 중이다. 씨라이언 AI는 동남아시아 언어 단일 네트워크의 약자로 동남아시아 문화의 맥락, 언어 등을 더 잘 이해하는 대규모 언어모델이다. 다른 국가에 비해 규모는 작지만 타 문화권에 편향되지 않은 결과를 제공하고, 글로벌에서 소외되는 동남아시아의 정부와 기업, 학계를 위한 AI를 만드는 게 목표다.
이외에도 아랍에미레이트는 중동국가 최초의 아랍어 전문 LLM인 팰컨(Falcon)과 자이스(Jais)를 선보였고, 아부다비 정부는 AI71이라는 기업을 설립해 LLM 팰컨 2 등을 개발하는 등 독자적인 LLM 구축에 한창이다. 사우디아라비아는 비전2030을 통해 AI 분야에만 400억 달러(약 55조 2500억 원) 이상을 투자하며, 네이버와 협력해 아랍어 LLM 개발 및 데이터센터를 구축 중이다. 카타르 역시 2025-2030 전략을 통해 디지털 전환을 추진하며, AI 및 클라우드 인프라에 28억 달러(약 3조 8600억 원)를 투자한다.
데이터 식민주의 시대 올 것··· 소버린 AI는 방어 수단
울리세르 알리 메히아스(Ulises Ali Mejias) 뉴욕주립대 교수와 닉 콜드리(Nick Couldry) 런던 정치경제대학교 교수가 2019년 서술한 데이터 그랩(Data Grab)에는 ‘데이터 식민주의’라는 개념이 등장한다. 이 책은 데이터 수집이 어떤 과정을 거쳐 수집돼 개인과 사회에 영향을 미치고, 새로운 형태의 자본주의가 될 수 있음을 경고한다. 챗GPT가 등장하기 이전의 책인 까닭에 빅테크 기업들의 데이터 수집과 관련된 내용에 집중하지만, AI가 전 세계적으로 활용되는 지금 단계에는 국가와 국가 간의 데이터 식민주의가 이뤄질 수 있음을 유추할 수 있다.
그리고 데이터그랩의 마지막 장은 ▲ 시스템에 저항하기 ▲ 시스템에 맞서기 ▲ 시스템을 넘어서기로 끝난다. 데이터의 공유와 접근성을 높이고, 개인과 국가의 정보 통제력을 확보해 데이터 주권을 강화하고, 관련 제도를 법제화해 데이터의 악용을 규제해야 한다는 내용을 담는다. 빅테크와 개인 간에서는 개인정보보호를 잘하고 늘 경계하자 정도지만, 국가와 국가 단위에서 쓰이는 수단이 ‘소버린 AI’인 셈이다.
소버린 AI는 AI 신토불이도 아니고, K-LLM을 만들고 끝나는 사업이 아니다. LLM은 소버린 AI의 실현 방식 중 하나일 뿐, 큰 그림으로 보면 ‘외산 AI에 휘둘리지 않고 자체적으로 활용할 수 있는 AI와 인프라를 구축하는 전반적인 과정’에 가깝다. 국가와 국가 간의 데이터 식민주의가 가능해질 시대에서 다른 국가의 AI 및 인프라에 종속되는 것을 막기 위한 방어수단인 셈이다.
이재명 대통령이 띄운 AI 100조 원 정책은 유래 없이 큰 규모의 사업이고, 이에 대한 우려의 목소리도 작지 않다. 하지만 AI의 중요성을 간파한 모든 국가들이 일단 예산부터 먼저 투입하는 식으로 경쟁을 시작했고, 우리도 마찬가지다. 과학기술정보통신부는 23일부터 다음 달 21일까지 공공 및 민간 데이터 보유 기관을 대상으로 데이터 공급 기관을 공개 모집하는 것으로 본격적인 AI 정책의 시작을 알렸다. 한국형 소버린 AI에 막대한 예산이 투입되는 만큼, 신중하면서도 확실한 투자가 이뤄져야 할 것이다.
IT동아 남시현 기자 (sh@itdonga.com)