[컴퓨텍스 2025] "인공지능 공장 시대" 외친 엔비디아 블랙웰 제품군의 개념은?

강형석 redbk@itdonga.com

젠슨 황 엔비디아 CEO가 컴퓨텍스 2025 기조연설을 진행하고 있다 / 출처=엔비디아
젠슨 황 엔비디아 CEO가 컴퓨텍스 2025 기조연설을 진행하고 있다 / 출처=엔비디아

[IT동아 강형석 기자] 2025년 5월 19일, 엔비디아는 대만 타이베이에서 개최되는 컴퓨텍스 2025 기조연설을 진행했다. 젠슨 황(Jensen Huang) 엔비디아 최고경영자(CEO)는 연단에 올라 데이터 센터와 인공지능, 다양한 블랙웰 플랫폼을 공개했다. 데이터 센터 외에도 중소기업, 개인 개발자 시장을 적극 공략함으로써 시장 영향력을 확대할 것으로 예상된다.

이제 인공지능 데이터 센터가 아니라 ‘인공지능 공장’

“새로운 애플리케이션은 수많은 프로세서가 함께 작동하며 수백만 명 이상 사용자에게 결과를 제공해야 됩니다. 이제 데이터 센터는 근본적으로 다른 아키텍처로 설계되어야 합니다. 이제 데이터 센터는 컴퓨팅의 단위가 되었고 더 이상 단순한 컴퓨터, 서버가 아닙니다. 정보, 저장장치를 제공하고 모든 기업 자원 관리(ERP – Enterprise Resource Planning) 시스템과 직원을 지원하는 1조 달러 규모의 산업입니다.”

젠슨 황 CEO는 지금의 데이터 센터는 단순한 시설이 아니라 인공지능 공장(AI Factory)라는 점을 강조했다. 전 세계 산업과 기업에 인공지능이 필수인 상황에서 데이터 센터 구축에 필요한 인프라(시설) 확보가 필수라는 점을 강조하기 위함으로 풀이된다. 여기서 인프라는 데이터 센터 설립 부지부터 전력, 네트워크 시설, 컴퓨팅 장비 등이 포함된다.

쿠다-엑스 라이브러리는 다양한 산업에 적용되고 있다 / 출처=엔비디아
쿠다-엑스 라이브러리는 다양한 산업에 적용되고 있다 / 출처=엔비디아

인공지능 공장은 에너지(전력)를 인가할 경우 큰 가치를 생산한다는 게 젠슨 황 CEO의 설명이다. 인공지능 학습에 따른 데이터는 ▲학술 논문 분석 ▲사진영상 생성 ▲생명공학 ▲자연현상 ▲물리연산 등 다양하다. 인공지능 학습 데이터들은 ‘토큰’으로 전환되어 기업의 자산이 된다.

기업이 데이터 센터(인공지능 공장)를 구축하고 인공지능 학습, 추론 환경을 구축하려면 최적의 소프트웨어 개발 묶음(라이브러리)이 필요하다. 엔비디아는 쿠다-엑스(CUDA-X) 라이브러리로 엔비디아 그래픽 처리장치(GPU)의 자원을 최대한 활용할 수 있다는 점을 강조한다.

쿠다-엑스 라이브러리는 13종이다. 반도체 설계, 물리학, 양자 컴퓨팅, 의학 분석, 우주ㆍ지구 분석, 5Gㆍ6G 신호 처리 분석 등 산업 모든 분야에 걸쳐 있다. 엔비디아 쿠다-엑스 라이브러리는 약간의 명령어(코드)를 개발 도구에 연결함으로써 인공지능 분석 속도를 높인다는 점을 강점으로 꼽았다.

젠슨 황 CEO는 전 세계 클라우드 데이터 센터가 소프트웨어로 정의된 것처럼 통신 분야도 소프트웨어로 정의해야 된다고 언급했다. 엔비디아는 완전 가속 무선 접속망을 개발하고 최적화하는 데 6년을 보냈으며 효율성, 성능 측면에서 전용 반도체(ASIC) 수준의 성능을 낸다는 점도 덧붙였다. 통신 데이터 처리 과정에 인공지능을 붙여도 될 수준에 이르렀다는 이야기다.

엔비디아는 양자 컴퓨팅의 부족한 부분을 그래픽 처리장치로 보완하는 방법을 제안했다 / 출처=엔비디아
엔비디아는 양자 컴퓨팅의 부족한 부분을 그래픽 처리장치로 보완하는 방법을 제안했다 / 출처=엔비디아

통신에 인공지능 개념을 도입할 수 있었던 이유로 양자 컴퓨팅이 언급됐다. 아직 노이즈가 많은 니스크(NISQ – Noisy Intermediate-Scale Quantum) 단계의 중간 규모 양자 컴퓨팅이지만 응용 분야는 많다. 엔비디아는 양자 컴퓨팅과 연계 가능한 쿠다-큐(CUDA-Q) 라이브러리를 개발 중이며, 양자 컴퓨팅 기업과 협력할 방침이다.

양자 컴퓨팅 성능은 그래픽 처리장치 대비 우위에 있다. 하지만 두 장치를 병행하면 데이터의 전ㆍ후처리 외에 오류 수정과 제어 등 부족한 점을 보완할 수 있다. 이 부분을 예로 들어 향후 모든 데이터 센터 장비에 양자 가속기가 장착될 것이며, 양자 처리장치(QPU)ㆍ그래픽 처리장치(GPU)ㆍ중앙처리장치(CPU)가 결합된 형태가 될 것으로 내다봤다.

중소 규모 인공지능 연구 시장 겨냥한 장비 공개

젠슨 황 CEO는 데이터 센터를 위한 그레이스 블랙웰(Grace Blackwell) GB300 외에도 중소규모에서 운용 가능한 장비를 공개했다. 엔비디아는 마이크로소프트, 메타, 구글, 아마존 등 대형 인공지능ㆍ클라우드 서비스 기업을 위한 대규모 장비 위주로 제품을 판매했다. 규모가 작은 인공지능 기업은 지포스 RTX 그래픽카드 혹은 RTX 그래픽 처리장치를 구매할 수밖에 없었다. 문제는 비용을 이유로 중소기업과 연구소 등이 저렴한 지포스 RTX 그래픽카드를 구매한다는 점이다. 이는 시장 공급 왜곡 현상으로 이어져 게이머의 불만으로 이어졌다.

개인 개발자 연구실에서 인공지능 학습이 가능한 DGX 스테이션 / 출처=엔비디아
개인 개발자 연구실에서 인공지능 학습이 가능한 DGX 스테이션 / 출처=엔비디아

문제를 최소화하고자 엔비디아는 소형 인공지능 가속기, DGX 스테이션(DGX Station)을 공개했다. 일반 데스크톱 컴퓨터와 비슷한 형태지만 데이터 센터에 쓰이는 그레이스 블랙웰 GB300 칩이 탑재된다. 20 페타플롭스(PFLOPS – 초당 1000조회 부동소수점 계산) 성능을 내며 800GB 용량의 공유 메모리로 다양한 언어모델 처리가 가능하다. 초당 800기가비트(Gb) 전송이 가능한 네트워크 연결도 지원한다. 800기가비트는 초당 50기가바이트(GB)에 해당한다.

중소규모 기업에서 인공지능 학습을 지원하는 RTX 프로 서버도 공개됐다 / 출처=엔비디아
중소규모 기업에서 인공지능 학습을 지원하는 RTX 프로 서버도 공개됐다 / 출처=엔비디아

RTX 프로(Pro) 서버도 공개했다. 전문가용 그래픽카드 RTX 프로(Pro) 6000 그래픽카드 8장을 시스템 내에 탑재해 최대 30 페타플롭스(FP4 부동소수점 처리 기준) 인공지능 처리 성능을 제공한다. RTX 그래픽카드가 탑재된 것이어서 실시간 환경 처리가 필요한 디지털 트윈(Digital Twin)에도 적합하다. 그래픽카드 당 100GB 메모리가 제공되고 초당 800기가비트 전송 가능한 네트워크 연결을 지원한다. 젠슨 황 CEO는 RTX 프로 서버는 H100 HGX 장비 대비 4배 뛰어난 성능을 제공한다고 언급했다.

젠슨 황 CEO는 컴퓨텍스 기조연설 대부분을 블랙웰 시스템의 강점을 언급하는 데 썼다. 중국 인공지능 반도체 기업 중심으로 인공지능 가속기를 선보이고 있는 것에 대한 대응으로 풀이된다. 최근 엔비디아는 사우디 인공지능 기업 휴메인과 500메가와트 규모의 데이터 센터 장비 판매 계약을 맺었다. 중국발 판매 규제를 상쇄하는 효과는 있겠지만, 빨리 대응하지 못하면 시장 불안감은 커질 전망이다. 엔비디아는 중국용 인공지능 가속기 H20에 대응하는 후속 제품을 선보일 예정이다.

IT동아 강형석 기자 (redbk@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.