[생성 AI 길라잡이] 빅테크 뒤집은 中 딥시크, 기우일까 혁명일까?
※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.
[IT동아 남시현 기자] 미국 현지시간으로 지난 27일, 엔비디아의 주가가 하루 만에 약 17% 폭락했습니다. 시가총액으로는 5888억 달러, 우리 돈으로 863조 원으로 미국 증시 역사상 최대 규모입니다. 엔비디아뿐만 아니라 AI 반도체 기대주로 떠오른 브로드컴도 17%, Arm도 10%가 떨어졌으며, 인공지능 및 반도체 관련주로 구성된 필라델피아 반도체 지수가 9.15%로 수직 낙하했습니다. 원인은 2023년 5월 창업한 중국의 신생 스타트업, 딥시크(DeekSeek)의 ‘딥시크-R1’ 대형언어모델(LLM) 출시 하나 때문이었습니다.
미국 AI 반도체 주식이 폭락하며 전 세계 AI 기업과 각국의 증시가 큰 충격을 받았지만, 지금은 낙폭을 회수하며 정상 궤도로 복귀한 상황입니다. 전 세계적으로 AI 스타트업이 LLM을 공개하는 일은 있는 일이지만, 왜 딥시크-R1 공개에만 전 세계 증시가 반응한 것인지. 또 공개 이후와 앞으로의 AI 시장의 향방은 어떻게 될지를 탐구해 보겠습니다.
딥시크는 어떻게 AI 반도체 기업의 역린을 건드렸나
딥시크는 중국의 양적 헤지펀드 하이플라이어(High-Flyer, 중국명 : 幻方量化)가 2023년 인공일반지능(AGI) 구축을 목표로 설립한 AI 스타트업입니다. 최고경영자는 하이플라이어의 공동설립자인 량원펑(梁文锋)이 맡고 있으며, 약 150명의 중국인 연구자 및 엔지니어, 31명의 데이터 자동화 연구팀으로 구성됩니다. 양원펑은 2008년 기계학습을 통해 양적 거래를 수행하는 방법에 대해 연구했고, 이때 습득한 지식을 바탕으로 2015년 하이플라이어를 설립합니다. 이후 AI 연구를 지속하다가 2023년 5월에 딥시크를 설립하고 AI 개발에 나선 것이죠.
딥시크는 설립 5개월 만에 대형 모델인 딥시크-코더를 공개했고, 24년 1월에는 메타 라마 2-7B보다 성능은 높고, 계산 복잡도는 60% 줄인 딥시크-MoE를 출시했습니다. 5월에는 딥시크-MoE의 대형 모델인 딥시크-V2를 공개하고 오픈소스로 누구나 이용할 수 있도록 만들었는데, 유료 모델의 비용이 GPT-4 터보의 1%에 불과해 화제가 됐습니다. 6월에는 GPT-4 터보와 비슷한 수준의 코딩 성능을 보유한 딥시크-코더 V2를, 11월에는 첫 번째 추론 모델인 딥시크-R1-라이트까지 출시합니다.
여기까지는 개발 속도가 대단히 빠른 AI 스타트업인데, 12월에 세 번째 대형언어모델인 딥시크-V3를 오픈소스로 공개하며 전 세계적인 주목을 받기 시작합니다. 딥시크는 V3 모델이 엔비디아의 저성능 AI 반도체 H800으로 55일 만에 완성했고, 비용도 557만 달러(약 81억 원)이라 밝혔습니다. 오픈AI가 GPT-4 학습에 엔비디아 H100과 약 1억 달러(약 1454억 원)를 들인 점과 비교하면 18분의 1의 비용만 쓴 셈입니다.
그런 데다가 성능은 알리바바의 LLM 큐웬 2.5-72B 및 메타 라마 3.1-405B보다 성능이 높고, GPT-4o와 클로드 3.5 소네트와 대등한 수준으로 평가됩니다. 개발 비용은 타사 대비 10% 이하인데, 성능은 대등하거나 더 낫다는 의미입니다. 최신의 고성능 칩을 쓸 필요도 없고, 일반 컴퓨터에서도 무난하게 사용할 수 있습니다. 즉 AI 기업들이 엔비디아의 최신 칩을 살 이유가 없다는 말이 되기 때문에 엔비디아의 주가가 폭락한 거죠.
투입 대비 산출 공식 벗어난 딥시크, 어떤 원리인가?
딥시크가 논란이 된 이유는 개발 효율입니다. 미국 정부가 중국의 AI 개발을 겨냥해 고성능 반도체 수출을 금지했지만, 저성능 반도체로 미국 유수의 AI들을 제쳤기 때문이죠. 딥시크는 LLM의 구조적 효율 덕분이라고 주장합니다. 딥시크-V3는 총 6710억 개의 매개변수를 갖췄고, 전문가 혼합(Moe, Sparse Mixture of Experts) 아키텍처를 기반으로 토큰당 370억 개의 매개변수만 활성화합니다. 오픈AI의 GPT에게 질문하면 도서관 전체에서 해답을 찾아 제공한다면, 딥시크는 해답에 적절한 구획을 찾아가 답을 찾습니다. 논문에서는 기존 모델 대비 최대 88%까지 효율적이라고 말합니다.
또한 멀티헤드 잠재 집중 (MLA, Multi-Head Latent Attention) 메커니즘으로 입력 문장 중 유의미한 내용만 추출해 계산합니다. 원래 집중 메커니즘은 문장을 컴퓨터로 보내는 인코딩 과정에서 답변과 관련성이 높은 단어들에 더 집중합니다. 다만 문장을 처리할 때는 전체 입력을 다시 참고하는데, MLA은 이 과정에서 필요한 부분만 다시 복기합니다. 덕분에 메모리 사용량이 줄어 작업 효율은 높아지고, 더 효율이 낮은 반도체로도 성능을 확보한 것이죠.
하지만 이것만으로는 해명이 충분하지 않은건 사실입니다. 개발 비용 557만 6000달러는 단순히 엔비디아 H800 GPU를 시간당 2달러에 2개월간 빌린 비용이고, 인건비나 모델 훈련비, 하드웨어 비용 등의 제반 비용은 고려가 안됐기 때문입니다. 또한 매개변수는 어떻게 가져왔는지, 테스트 비용 이외의 자산은 어떻게 구성되는지, 또 과도하게 데이터를 수집하는 이유와 활용처는 무엇인지는 구체적으로 밝혀지지 않았습니다. 과정은 생략하고 딥시크-V3와 딥시크-R1을 오픈소스로 누구나 다운로드해 써보고, GPT o1만큼 성능이 뛰어나다는 사실이 확인된 게 현재 상황입니다.
결과적으로 증시가 폭락한 이유는 딥시크의 개발 비용이 저렴했는데도 성능이 GPT o1과 큰 차이가 없었다는 데 있습니다. 대다수 AI 기업들이 수천억 원을 소모해가며 AI 학습을 위한 엔비디아 GPU를 구매하는데, 고사양 AI 반도체가 없어도 AI를 만들 수 있다는 말이 되니까요. 그래서 엔비디아, 브로드컴 등 AI 반도체 기업들의 주식은 크게 떨어진 반면, AI를 저렴하게 활용할수록 수익성이 높아지는 세일즈포스, 허브스팟, 서비스나우 등의 소프트웨어 기업 주가는 올랐던거죠.
오픈AI 자산 끌어다 쓴 의혹, 미국 정부 조사 소식도
개발 과정이 불투명하다는 점은 당분간 딥시크의 발목을 잡을 것입니다. 오픈AI는 지난 29일 파이낸셜 타임즈와의 인터뷰를 통해 딥시크가 오픈AI의 개발 모델을 훔친 증거가 있다고 밝혔습니다. 블룸버그 역시 마이크로소프트의 보안 연구원들이 지난해 가을, 누군가 오픈AI의 API를 활용해 대량의 데이터를 출력했으며 이것이 딥시크와 연관되었을 가능성에 대해 조사 중이라는 보도를 냈습니다. 오픈AI의 API를 가져다가 자사 서비스에 탑재하는 것은 흔하지만, 이를 통해 자체 경쟁 모델을 만드는 것은 불법입니다.
실제로 논문에서도 ‘콜드스타트 데이터’를 만들기 위해 강화학습이 적용된 고품질 예시 데이터를 주입해 답변을 안정화해 성능을 높였다는 내용이 나옵니다. 콜드스타트는 시스템을 구축할 때 데이터 공백으로 발생하는 구축이 어려운 상황을 말하는데, 이를 위해 콜드스타트 데이터를 제공해 학습 기반을 마련합니다. 여기에 사용된 콜드스타트 데이터에 오픈AI의 데이터가 쓰인 것이 아닌가 의혹이 제기되는 상황입니다.
과도한 데이터 수집 범위도 논란입니다. 하정우 네이버클라우드 AI 이노베이션 센터장은 SNS를 통해 “딥시크의 개인정보 수집 범위가 매우 광범위하다. 사용 장비 정보는 물론 키보드 입력 패턴이나 리듬, IP정보, 장치 ID 등은 기본이고 쿠키까지 수집한다. 정보는 중국 내 보안 서버에 저장되며 이를 숙지하고 써야 한다”라고 말했습니다. 이미 우리나라를 비롯해 영국, 프랑스 등은 개인정보 보호 관련 질의 전달 및 이용 검토에 들어갔고, 이탈리아와 미국 국방부와 하원의회는 딥시크 설치를 금지했습니다.
아울러 다리오 아모데이 엔트로픽 CEO는 딥시크가 5만 개의 호퍼칩을 보유했다고 주장했고, 알렉산더 왕 스케일AI CEO도 CNBC와의 인터뷰에서 딥시크가 출처를 알 수 없는 5만 개의 H100 칩을 갖고 있을 것이라 주장했습니다. 일론 머스크도 알렉산더 왕의 발언을 두고 ‘분명히 그럴 것’이라는 응답을 남기기도 했습니다.
미국의 반도체 조사 기업 세미애널라이시스는 ‘2021년 하이플라이어가 1만 개의 A100를 구매한 기록이 있으며, 수출 통제를 고려해도 추가로 5억 달러(약 7200억 원)의 GPU를 구매했을 것이다. 지금은 적어도 1만 대의 H800과 H100을 보유했을 것으로 보인다’는 보고서를 내놓기도 했죠. 결국 미국 상무부, 연방수사국(FBI)이 딥시크가 대중 수출이 금지된 미국산 반도체를 사용했는지에 대한 조사를 시작한 상황입니다.
AI 업계의 스푸트니크 쇼크 될까, 해프닝으로 끝날까
딥시크발 충격을 두고 실리콘밸리의 유명 투자자 마크 앤드리슨은 “AI의 스푸트니트 순간’이라 말했고, 업계에서는 미국의 강력한 반도체 수출규제가 중국의 약진으로 이어졌다고 평가합니다. 미국이 다져온 AI 패권이 주가 폭락과 함께 내려앉고, 중국계 AI가 시장을 주도할 것이라고 생각할 수 있습니다. 하지만 전체 상황을 짚어보면 단정하긴 이릅니다. 생각해보면 스푸트니크 쇼크로 충격을 받은 미국은 소련보다 먼저 유인 달 착륙을 성공했고, 더 나아가 미국 전반의 과학기술을 급속도로 발전시켜 지금의 미국을 만들었죠.
딥시크 쇼크도 그렇습니다. 딥시크가 오픈 AI 대비 10% 이하의 자원으로 동급의 AI 모델을 구축한 게 맞다면, 미국발 AI 빅테크 기업들도 같은 방식을 채용할 것입니다. 이미 관련 자료가 모두 공개돼 있으니 도입은 쉽고, 규모의 경제와 원본 데이터, 고성능 GPU도 모두 갖췄으니 결과는 뻔합니다. 한편으로는 AI 개발을 위해 고가의 GPU를 쓸 필요가 없어져 스타트업도 AI를 개발할 수 있게 되고, 더 많은 AI가 등장할 것입니다. 유지비가 저렴해져 성능이 더 높은 AI를 더 저렴하게 쓰고, 전력 문제나 GPU 품귀 현상 등에도 영향을 미칠 것입니다.
결과적으로 딥시크가 제시한 높은 효율성과 성능이 사실이라면 좋은 소식입니다. 글로벌 AI 기업들은 한층 더 발돋움할 수 있는 계기가 될 수 있고, 이로 인한 수혜를 인류 전체가 받게 됩니다. 반면 딥시크가 고성능 GPU를 대거 투입해 만든 뒤, 시선 집중을 위해 투입 및 운영 비용을 속였다면 해프닝으로 끝날 수 있습니다. 딥시크가 자사 AI를 오픈소스로 공개한 만큼, 이미 결과물은 증명이 되었습니다. 이제 남은 과제는 이것을 만든 과정이 사실이었는지, 또 얼마나 투명하게 사용할 수 있는지를 입증하는 데 있습니다.
IT동아 남시현 기자 (sh@itdonga.com)