SKT·Arm·리벨리온 3각 동맹··· Arm AGI 기반 서버에 리벨리온 NPU 탑재한다
[IT동아 남시현 기자] SK텔레콤과 리벨리온이 Arm의 자체 설계 반도체 ‘AGI’를 바탕으로 인프라 공동 설계에 나선다. Arm은 지난 3월 24일(현지시각) 개최한 ‘Arm Everywhere’ 행사에서 35년 만에 처음으로 자체 IP(지식재산)으로 설계한 반도체 ‘AGI’를 출시했다. 그간 Arm은 반도체 설계에 필요한 지식재산, 즉 설계도를 제공하는 수준으로 반도체 산업을 지원해 왔는데 AGI를 통해 완제품 반도체 시장까지 진출한 것이다. 이 AGI를 바탕으로 만든 시스템에 리벨리온의 신경망처리장치(NPU)를 얹고, SK텔레콤의 AI 데이터센터로 실증하는 것이 이번 협력의 골자다.

현재 서버용 CPU 시장은 인텔, AMD가 양분하고 있다. x86 기반 시스템은 높은 성능과 확장성을 갖췄지만 전력 효율이 Arm CPU보다 떨어진다. Arm AGI는 ‘가장 효율적인 에이전트형 CPU’를 표방하며 틈새를 파고든다. AGI는 Arm 네오버스 CSS V3를 기반으로 설계되며 x86대비 높은 전력효율과 서버 밀집도를 제공한다. 이번에 출시된 AGI는 136 코어를 탑재하며, 공랭식 36kW급 랙으로는 최대 8160개 코어를 탑재할 수 있다.
확장 장치 지원은 PCIe 6세대 96레인, CXL 3.0을 지원하며, 서버시장의 새로운 표준인 오픈 컴퓨트 프로젝트(OCP) 기반으로 설계돼 하이퍼스케일러들의 도입 장벽을 낮췄다. 리벨리온의 반도체는 이 CPU를 기반으로 한 시스템에 GPU 대신 장착된다. 출시 당시 ‘리벨 쿼드’로 알려진 칩은 ‘리벨100’이라는 정식 명칭이 부여되었으며, 리벨카드라는 모듈화 형태의 카드 제품으로 탑재된다.
Arm AGI 기반 시스템에 리벨100 탑재로 시장 공략

리벨100은 4개의 NPU를 UCIe-어드밴스드 표준 기반의 칩렛으로 엮었다. 칩렛이란 서로 다른 종류와 공정의 반도체 다이를 하나의 패키지로 엮는 기술이다. 칩을 단일 공정으로 제조할 필요가 없어 성능 확보와 경제성을 모두 만족한다. 칩 간 통신속도에 따른 제약이 있지만 최근에는 애플, 엔비디아, AMD 등도 칩렛 구조를 채택할 정도로 큰 한계는 없다. 내부 메모리는 초당 4.8TB의 대역폭을 갖춘 HBM3E 144GB가 탑재돼 100~200B 급 대형 언어모델도 한 번에 로딩할 수 있다.
이번 발표에서 주목할만한 점은 리벨리온과 Arm이 단순한 하드웨어 조합을 넘어 펌웨어 등 소프트웨어까지 공동 개발에 나선다는 부분이다. 소비자용 PC 수준에서는 PCIe나 CPU 호환성 정도만 확인하면 되도록 표준화가 되어있지만, 서버 수준에서는 펌웨어와 드라이버, 엔비디아 쿠다 같은 추상화 레이어 등 고려할 부분이 많다. 대규모 AI 모델 구현을 위한 분산 컴퓨팅 기술, 오류를 자동 복구하는 기능같은 서버 수준의 신뢰성 기능까지 모두 포함되어야 한다.

인텔, AMD CPU와 엔비디아 그래픽카드가 서버 시장의 강자로 통하는 이유는 수십 년에 걸쳐 이런 문제점들을 꾸준히 업데이트하고 생태계를 다져온 결과다. 반면 이제 막 등장한 Arm AGI나 리벨리온 NPU 조합은 PCIe 등으로 연결성만 확보됐고 상세한 제품 신뢰성과 호환성, 확장성은 이제 시작 단계다. 두 기업이 펌웨어 단계에서 제품을 구성한다는 의미는 하드웨어를 하나의 장치처럼 연결하고, 통합된 명령어 실행 환경까지 구축한다는 의미로 볼 수 있다.
Arm 기반 서버에 리벨리온 NPU 시장 영역 생길 듯
이번 3자간 협력은 단순히 제품을 만들겠다를 넘어서 Arm 서버 생태계에 리벨리온 NPU를 위한 고유한 시장 영역을 만들겠다는 의미가 녹아있다. 빅테크 기업들은 특정 업체의 제품이나 서비스에 종속되는 ‘밴더 록인’을 경계한다. 서버 시장에서는 엔비디아의 GPU가 대표적이며, 메타나 AWS 등 기업들은 가격 협상과 제품 수급 경로의 다각화 등을 위해 타사 제품이나 자체 제품도 함께 채워 넣고 있다. 업계에서 GPU를 대체하는 제3의 추론용 반도체를 찾는다면 Arm과 리벨리온 제품이 가시권에 들어올 수 있는 상황이다.

생태계 확보 측면에서도 이상적이다. 두 기업 제품에 대한 협업은 1세대 AGI와 리벨100에서 그치지 않고 앞으로 출시되는 CPU와 NPU로 이어질 것이며, RBLN SDK의 시장 영향력과 활용도는 더 커질 수 있다. 리벨리온은 이미 예전부터 RBLN SDK에서 텐서플로, 파이토치 등으로 훈련된 딥러닝 모델을 지원 중이며 vLLM, 엔비디아 트리톤 추론 서버 연결성 등을 확보해 기존 GPU 기반 AI 엔지니어들의 접근성을 높였다.
SK텔레콤은 이 제품을 데이터센터에 도입해 도입 사례를 확보하고, 독자 AI 파운데이션 모델인 A.X-K1을 운용하는 방안도 구상 중이다. 실제 운용을 통해 시스템 전반의 단위 시간당 처리량, 지연 시간, 가속 비율, 전력 소모대 성능비 및 총 소유비용 데이터, 평균 가동 시간이나 운영 안정성 등 신뢰성 데이터가 확보되면 다른 기업들이 도입할 때 큰 도움이 된다.
리벨리온의 발 빠른 Arm AGI 협력, 선점 효과에 기대

리벨리온과 Arm의 협력 구도는 두 기업 모두에게 장기적인 이득이다. 예를 들어 미국의 AI 반도체 기업 세레브라스는 Arm와의 협력을 통해 생태계 확보, 확장성 등 모든 부문에서 이득을 거둘 전망이다. 세레브라스는 웨이퍼 자체에 90만 개의 AI 코어를 통째로 인쇄한 WSE-3라는 칩을 제조하는 AI 반도체 기업이다. 대역폭, 서버 상면 확보 측면에서는 대단히 유리하나 특수한 시스템이어서 세레브라스가 직접 도입 및 운용을 지원한다. Arm AGI를 적용하면 데이터 이동, 네트워킹, 대규모 조정 등의 편의성이 크게 나아질 전망이다. Arm과 리벨리온의 협력도 Arm과 세레브라스의 사례처럼 윈윈(win-win)하는 구조다.
한편 Arm은 AGI를 성공시키기 위해 리벨리온 이외에도 또 다른 AI 가속기 기업들을 계속 포섭할 것이다. 리벨리온이 먼저 출발했다는 이점은 있지만 이를 잘 발전시키고 추가 도입 사례까지 만들어야 할 것이다. Arm은 올해 하반기 중 가장 첫 고객인 메타에 제품을 공급할 예정이다. Arm AGI와 리벨리온 리벨100 모두 완성된 제품인 만큼 빠르면 올해 안에 펌웨어 및 소프트웨어 등을 완성하고 SK텔레콤이 실증을 시작할 것으로 예상된다.
IT동아 남시현 기자 (sh@itdonga.com)

