인텔, 가속기 12개로 데이터센터 강화하는 4세대 제온 스케일러블 프로세서 출시

김영우 pengo@itdonga.com

[IT동아 김영우 기자] 기업 비즈니스의 디지털화, 클라우드화가 본격화되면서 데이터센터의 중요성 역시 커졌다. 관련 기업들이 한층 강력하고 효율적인 데이터센터의 개발 및 확보에 힘을 기울이고 있는 가운데, 인텔의 인공지능(AI) 및 네트워킹, 고성능 컴퓨팅 관련 능력을 강화한 '4세대 인텔 제온 스케일러블 프로세서(코드명 사파이어 래피즈)', 그리고 '인텔 제온 CPU 맥스 시리즈(코드명 사파이어 래피즈 HBM)'와 '인텔 데이터센터 GPU 맥스 시리즈(코드명 폰테베키오)'의 출시를 발표했다.

4세대 인텔 제온 스케일러블 시리즈를 소개하는 인텔코리아의 나승주 상무
4세대 인텔 제온 스케일러블 시리즈를 소개하는 인텔코리아의 나승주 상무

11일, 인텔코리아는 서울 여의도의 전경련회관에서 기자간담회를 열고 신제품의 특징과 의의를 소개했다. 설명을 담당한 인텔코리아의 나승주 상무는 “인텔은 고객의 워크로드를 분석해 가장 높은 가치를 제공할 수 있는 제품으로 설계했으며, 미국에 생산 거점(팹)을 건설하고 파트너사들과 긴밀히 협력하는 등 원활한 공급을 위한 노력도 아끼지 않았다”라고 밝혔다.

주요 제품인 4세대 인텔 제온 스케일러블 프로세서의 가장 큰 특징은 현존 CPU 중 가장 많은 12개의 내장 가속기를 탑재했다는 점이다. 이를 통해 고객사의 특정 비즈니스(AI, 데이터 분석, 네트워킹, 스토리지, HPC 등)에 최대의 작업 효율을 낼 수 있다고 인텔은 강조했다. 대표적인 것이 '인텔 어드밴스드 매트릭스 익스텐션(인텔 AMX)' 기능으로, 2D 타일 연산을 통한 AI 추론과 학습 기능에 최적화되었다.

4세대 인텔 제온 스케일러블 시리즈에 탑재된 주요 가속기 소개
4세대 인텔 제온 스케일러블 시리즈에 탑재된 주요 가속기 소개

인텔 AMX를 통해 하나의 프로세서에서 스칼라, 벡터, 매트릭스 연산이 가능하며, 기존의 AVX-512에 비해 24배 이상, AVX-512(VNNI)에 비해 8배 이상의 처리 효율을 기대할 수 있다. 또한 이전 세대 제온 프로세서 대비 10배 더 높은 파이토치(PyTorch, 파이썬을 위한 오픈소스 머신 라이브러리) 실시간 추론 성능을 발휘한다고 밝혔다.

'인텔 다이내믹 로드 밸런서(인텔 DLB)' 역시 주목할 만한 내장 가속기다. 이는 특정 코어에 부하가 몰리는 것을 방지하는 하드웨어 레벨의 기능으로, 분산 처리 및 동적 네트워크 처리 재정렬을 통해 시스템의 성능을 향상시킬 수 있다. 이를 통해 96%의 지연 시간 단축 효과가 있다고 인텔은 강조했다.

4세대 인텔 제온 스케일러블 시리즈에 탑재된 주요 가속기의 원리
4세대 인텔 제온 스케일러블 시리즈에 탑재된 주요 가속기의 원리

그 외에도 '인텔 스트리밍 가속기(인텔 DSA)'를 이용하면 데이터를 옮길 때마다 CPU가 개입하는 것을 최소화해 시스템 자원을 효율적으로 이용할 수 있다. 대용량 패킷 순차 읽기 IOPS 성능을 1.7배 높일 수 있으며, 이는 특히 클라우드 사업자들에게 유용하다. 이와 더불어 데이터 및 암호화 처리 속도 향상을 위한 '인텔 퀵어시스트(인텔 QAT)' 기술도 소개했다. 암호화 작업 시 84% 더 적은 코어 수를 요구하므로 그만큼 시스템 자원의 효율성을 높일 수 있다.

그리고 4세대 인텔 제온 스케일러블 프로세서는 이러한 성능을 원활히 발휘하기 위해 기존 DDR4 메모리 대비 최대 1.5 배의 메모리 대역폭을 발휘하는 DDR5 메모리, 기존 PCIe 4.0 대비 최대 2배의 I/O 대역폭을 발휘하는 PCIe 5.0 인터페이스를 지원한다.

4세대 인텔 제온 스케일러블 시리즈에 적용된 플랫폼의 특징
4세대 인텔 제온 스케일러블 시리즈에 적용된 플랫폼의 특징

또한 같은 공간의 시스템끼리 서로 원활하게 통신하며 성능을 확장할 수 있는 차세대 인터페이스인 'CLX 1.1', CPU 소켓 간 대역 폭을 이전 세대 대비 최대 1.9배 높인 'UPI 2.0'을 지원하는 등, 광범위한 에코시스템을 도입한 것도 눈에 띈다.

같이 발표된 인텔 제온 CPU 맥스 시리즈는 하나의 패키지에 고대역폭 메모리인 HBM2e를 내장하고 있으며, HPC(초고성능 컴퓨팅) 및 AI 워크로드 데이터 처리량 향상에 효과적이다. 그리고 인텔 데이터센터 GPU 맥스 시리즈는 1,000억개 이상의 트랜지스터를 47타일 패키지로 구성했으며, 물리학이나 금융 서비스, 생명 과학 등의 분야에 적합하다고 인텔은 밝혔다.

인텔 온디멘드 활성화 모델의 소개
인텔 온디멘드 활성화 모델의 소개

이날 인텔은 인텔 제온 제품군을 위한 '인텔 온디멘드 활성화 모델'도 소개했다. 4세대 인텔 제온 제품군은 다양한 사용 사례 및 애플리케이션에 대응하는 50여개 SKU(구분 모델)의 프로세서를 제공한다. 고객사는 제품 구매 시 자사의 목적에 적합한 맞춤형 제품을 주문할 수 있으며, 출고 후에도 비용 추가에 따라 특정 기능(가속기 장치 수 등)을 활성화해 성능을 업그레이드할 수 있다고 인텔은 전했다.

그 외에 인텔은 최적화된 파워 모드를 통해 최대 20%의 소켓 전력 절감 효과를 기대할 수 있으며, 제품 생산 과정에서 최신 물 재활용 시설을 갖춘 시설에서 약 90% 재생가능한 전력을 활용하는 등, 지속 가능성 부문에서도 만전을 기하고 있다고 강조했다.

4세대 인텔 제온 스케일러블 시리즈 및 인젤 제온 CPU 맥스 시리즈의 개요
4세대 인텔 제온 스케일러블 시리즈 및 인젤 제온 CPU 맥스 시리즈의 개요

한편, 인텔은 현재까지 총 8,500만개에 달하는 제온 스케일러블 프로세서를 출하했으며, 특히 3세대 제품의 경우 2년 이내 출하량이 1,500만개에 달하는 등, 제온 플랫폼의 성장세가 확연하다고 강조했다. 이와 더불어, 4세대 제온 스케일러블 프로세서는 작년부터 일부 고객사에 납품을 시작했으며, 차세대 제품인 코드명 ‘에메랄드 래피즈’가 올해 말 생산을 목표로 순조롭게 개발되고 있다는 소식도 전했다.

글 / IT동아 김영우(pengo@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.