메타 “올해 안에 세계 최고 성능 슈퍼 컴퓨터 AI RSC 완성”

[IT동아 차주경 기자] 메타(Meta)가 세계 최고 성능을 발휘하는 인공지능 슈퍼 컴퓨터 ‘AI RSC(Research SuperCluster)’를 2022년 중반까지 만들 계획을 밝혔다. 1초에 5000조 개의 작업을 해내는 메타 AI RSC가 완성되면, 인공지능과 메타버스 산업계에 새로운 활력이 될 전망이다.

메타는 2013년 인공지능 연구소를 만들고 다양한 모델을 만들었다. 인공지능을 가르칠 때 쓸 데이터의 종류가 많아지고 용량이 커지자, 자연스레 고성능 슈퍼 컴퓨터가 필요해졌다.

초기 인공지능 연구는 사진으로 컴퓨터 비전(사물을 분간하는 기술)을, 사람의 목소리로 음성 인식 기술을 개발하는 단계였다. 지금은 컴퓨터 비전을 만들 때 방대한 사진뿐 아니라 고화질 동영상도 활용한다. 음성 인식 기술은 콘서트 현장처럼 수많은 소리가 뒤섞인 상황에서 사람의 목소리만 포착하는 단계, 표준어뿐 아니라 방언이나 사투리까지 알아듣는 단계까지 발전했다. 대부분 슈퍼 컴퓨터 덕분이다.

메타 AI RSC 소개 사진. 출처 = 메타 블로그
메타 AI RSC 소개 사진. 출처 = 메타 블로그

메타는 페이스북 시절인 2017년, 엔비디아 V100 텐서 코어 GPU(인공지능 특화 그래픽 처리 장치) 2만 2,000개를 엮은 슈퍼 컴퓨터를 만들어 인공지능을 연구했다. 2020년에는 훨씬 더 방대한 데이터를 다양한 방식으로 분석해 심화된 인공지능 모델을 만들려 새 슈퍼 컴퓨터를 만들기로 결정했다.

이 슈퍼 컴퓨터는 3만 6,000년 분량의 동영상 데이터를 분석할 정도로 강력한 성능뿐 아니라 고도의 보안과 개인 정보 보호 기능, 안정성까지 갖춰야 했다. 메타가 AI RSC 연구를 시작한 계기다.

2021년 기준으로 만들어진 메타 AI RSC는 엔비디아 V100 텐서 코어 GPU보다 더욱 강력한 엔비디아 DGX A100 시스템을 760개 연결해 6,080개 GPU로 동작한다.

메타에 따르면 AI RSC의 초기 모델은 기존의 슈퍼 컴퓨터보다 컴퓨터 비전 작업 절차를 20배 더 빠르게 실행했다. 자연어 처리 모델을 훈련시킬 때 필요한 NCCL(집단 통신 라이브러리) 실행 속도도 9배나 빨랐다. 수백억 개의 매개 변수를 가진 인공지능 모델을 만들 때 기존에는 9주가 걸렸지만, 메타 AI RSC는 3주만에 이 모델을 만들었다.

순조롭게 만들어지던 메타 AI RSC는 코로나19 팬데믹 때문에 일어난 반도체 수급난의 악영향에 시달렸다. 메타는 이 때문에 AI RSC 연구진들이 원격으로 일하면서 설계도 상당 부분 바꿨다고 밝혔다. 한편으로는 인공지능 모델의 교육 효율을 높일 새로운 저장 공간 기술도 개발해 적용했다고 언급했다.

메타 AI RSC의 구성 일부. 출처 = 메타 블로그
메타 AI RSC의 구성 일부. 출처 = 메타 블로그

메타는 AI RSC의 GPU 개수를 지금의 두 배 이상인 1만 6,000개로 늘려 성능을 2.5배쯤 높일 계획이라고 밝혔다. 컴퓨터의 성능 판단 기준인 초당 부동 소수점 연산 시, 이 슈퍼 컴퓨터는 5 엑사플롭(ExaFLOPS, FLoating point Operations Per Second) 속도를 낼 예정이다. 최고사양 게임용 PC보다 10억 배 빠른 속도이자, 슈퍼 컴퓨터 가운데 가장 우수한 성능이다.

메타 AI RSC의 저장 공간 용량은 175PB(1PB = 1024TB), 데이터 전송 대역폭은 초당 16TB에 달한다. 작업 효율을 높일때 쓰는 임시 저장 공간인 캐시 스토리지 용량도 46PB나 된다.

캐빈 리(Kevin Lee) 메타 기술 프로그램 관리자는 "메타 AI RSC가 지금보다 훨씬 정교하고 정확하게 움직이는 인공지능 모델, 새로운 사용자 경험을 가져다 줄 메타버스 기술을 현실로 이끌 것으로 기대한다."고 밝혔다.

글 / IT동아 차주경(racingcar@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.