[리뷰] 전문가용 GPU 시장에 경종을 울리다, AMD 라데온 프로 W7700
[IT동아 남시현 기자] 최근 몇 년 사이 인공지능 시장이 극적으로 발전하면서 그래픽 카드 수요도 크게 늘었다. 그래픽 카드의 처리 장치인 GPU를 게임이나 모니터 화상 출력 등의 작업이 아닌 기계학습, 심화학습 용도로 적용하면서 인공지능 개발 용도로도 쓰이기 시작한 것이다. 그 결과 게이밍 그래픽 카드는 물론 3D 렌더링이나 영상 작업, 암호화폐 채굴 용도로 쓰이던 카드까지 인공지능 수요가 흡수하는 상황이다.
AMD 역시 영상 렌더링이나 고부하 작업 용도의 전문가용 그래픽 카드인 라데온 프로 시리즈를 인공지능 용도로 확장하는 상황이다. AMD는 지난 7월 GPGPU 소프트웨어 및 고성능 컴퓨팅 환경을 위한 ROCm 플랫폼에 윈도우 지원을 추가했고, AMD RDNA3 아키텍처 기반의 장치에서 파이토치, ONNX, 텐서 플로 등으로 활용할 수 있게 됐다. 덕분에 엔비디아가 독식하고 있던 전문가용 그래픽 카드 시장에도 라데온 프로라는 대안이 선택지로 떠올랐다.
최신 AMD 라데온 프로 W7000 시리즈 라인업은 RDNA3 아키텍처를 기반으로 하며, 최상위에 AMD 라데온 프로 W7900 48GB가 있다. 그 아래로 W7800 32GB가 있고, 보급형 제품군이 W7600 8GB 및 W7500 8GB가 각각 있었다. 그리고 중견급 라인업인 W7700 16GB를 추가해 라인업을 완성했다. AMD 라데온 프로 W7700이 전문가용 그래픽 카드 시장에서 두각을 드러낼 수 있을지, 가볍게 성능을 짚어봤다.
16GB 메모리와 28 테라플롭스 급의 성능
AMD 라데온 프로 W7700 워크스테이션 그래픽 카드는 AMD RDNA 3 아키텍처를 기반으로 하며, 48개의 컴퓨트 유닛이 탑재돼 있다. 모델 학습에 주로 쓰이는 FP32은 28.3테라플롭스로 처리하며, 추론 처리에 주로 쓰이는 FP16은 56.54테라플롭스로 처리한다. 상위 제품인 W7800이 FP32 45.3테라플롭스, W7600이 19.9테라플롭스이므로 중앙값보다 조금 낮은데, 가격은 상위 제품의 40% 수준이니 가격 경쟁력은 확실하다.
메모리는 오류를 보정하는 ECC 기능이 추가된 GDDR6 메모리가 16GB 탑재되며, 메모리 대역폭도 256비트로 높다. 덕분에 최대 메모리 대역 속도는 576GB/s인데, 메모리 비트로 성능에 차등을 두는 엔비디아 그래픽 카드와 비교하면 훨씬 낫다.
인터페이스는 4개의 디스플레이 2.1 포트가 있고, 최대 4개의 4K 120Hz 출력 혹은 2대의 6K 12비트 HDR 60Hz 비압축 출력, 한 대의 8K 12비트 HDR 60Hz 비압축 출력, DSC 압축을 통해 최대 12K 120Hz 출력까지 지원한다. 장치 연결은 PCIe 4.0 16배속으로 체결되고, 최대 190W 수준의 전력을 요구해 8핀 전원 단자만 있으면 된다.
테스트로 확인한 라데온 프로 W7700의 실질 성능은?
AMD 라데온 프로 W7700의 실질적인 처리 성능을 확인해 보고자 작업용 그래픽 카드에 맞춰 테스트를 진행했다. 테스트 벤치는 AMD 라이젠 9 7950X와 32GB DDR5 메모리를 조합했다. 우선 UL벤치마크의 프로키온(Procyon) AI 추론 벤치마크를 활용해 인공지능 작업 시 주로 쓰이는 모델에 대한 FP32 처리 속도를 확인했다. 다만 벤치마크가 아직 AMD ROCm을 지원하지 않아 마이크로소프트 윈도우 ML을 활용했다.
결과는 각 모델을 3분간 사용해 추론을 수행한 뒤, 평균 추론 시간과 중간 추론 시간 및 총 추론 횟수를 기록한다. MobileNET V3의 경우 평균 0.73ms, ResNet50 2.39ms, Inception V4 7.76ms, DeepLab V3 18.01ms, YOLO V3 8.34ms, Real-ESRGAN 125.07ms로 확인된다. 전체 점수는 628점인데, W7800의 730점 대와 W7900의 850점 대와 비교해 단계적인 성능 차이를 보인다.
메모리 용량이 크게 상관없는 조건이라면 AMD 라데온 프로 W6800 32GB 모델과 비슷한 수준의 처리 속도를 기대할 정도며, ResNet 50과 REAL-ESRGAN에 한해서는 엔비디아 A6000과 비슷하다. 단순 처리 성능만 놓고 우위에 있다고 보기는 어렵지만 가격대 효율을 생각하면 인상적인 결과다
어도비 포토샵 및 라이트룸 클래식을 활용해 CPU 및 GPU의 종합 편집 성능을 확인하는 UL 프로키온의 포토 에디팅 벤치마크도 실행했다. 해당 테스트는 포토샵의 사진 및 AI 편집 기능, 라이트룸의 사진 배치 및 다구간 편집 등의 성능을 종합으로 측정함으로써 실질적인 사진 편집 성능을 확인한다. 해당 테스트에서 AMD 라데온 RX 7800 XT의 경우 이미지 리터칭에서 1만950점, 사진 일괄 처리에서 8081점을 획득했고, AMD 라데온 프로 W7700은 리터칭 1만162점, 일괄 처리 7842점을 획득했다.
두 그래픽 카드 간의 실질적인 성능 차이가 상당하지만, CPU 성능이 더 중요한 사진 편집 측면에서는 큰 차이를 보이지 않았다. 따라서 CPU 성능이 더 중요한 작업이라면 가격에 맞춰 제품을 구매하면 된다.
오픈GL 및 다이렉트 X 애플리케이션을 활용해 그래픽 카드의 뷰포트 성능을 측정하는 SPECviewperf 2020 테스트를 실행했다. 뷰포트는 작업 시 그래픽 카드가 제공하는 시각 데이터를 의미하는 말로, 테스트는 장면을 렌더링 하는 프레임의 속도를 기준으로 측정한다. 테스트는 FHD 해상도를 기준으로 3ds 맥스, 마야, 솔리드웍스 세개 소프트웨어를 대상으로 실행했다.
그 결과 3ds 맥스 테스트에서는 종합 167.81점, 마야 524.54점, 솔리드웍스 323.55점을 획득했다. 전반적인 성능은 기준으로는 AMD 라데온 RX 6800 및 W6800와 비슷하고, 엔비디아 쿼드로 RTX 6000보다는 낮은 수준이다.
일관된 3D 렌더링 작업을 수행하고, 분당 처리한 프레임으로 점수를 측정하는 블렌더 3.6 벤치마크도 실행했다. 그 결과 AMD 라데온 프로 W7700의 경우 총합 2277.58점을 획득했고, AMD 라데온 RX 7800 XT는 2385.41점을 획득했다. 실질 연산 성능으로는 격차가 상당한 편임에도 단순 렌더링 성능으로는 큰 차이가 없었다. W7700이 특정 작업을 효율적으로 처리한 덕분으로 보인다. 다른 그래픽 카드와 성능을 비교하자면 엔비디아 쿼드로 RTX 4000의 2342.57점보다는 소폭 낮고, 인텔 아크 A770의 2246.68점보다는 높은 수치다.
이외에도 가상현실(VR) 개발 및 게임 개발 시 그래픽 처리 성능을 확인하는 UL 벤치마크의 VR마크 오렌지 룸 테스트를 실행했다. 해당 테스트는 특정 VR 영상을 처리하는 속도로 점수를 환산한 뒤, 이를 다른 그래픽 카드의 점수와 비교하는 식이다. 해당 테스트에서 AMD 라데온 프로 W7700의 점수는 1만4637점으로 확인 되며, 엔비디아 쿼드로 RTX 5000의 평균 점수인 1만1072점보다 훨씬 높고, 엔비디아 RTX 4000 SFF Ada의 1만5635점과 비슷한 수준이다.
해당 테스트의 대조군이 많지 않은 관계로 해당 결과만으로 W7700의 성능이 뛰어나다고 말하기는 어렵다. 하지만 다수의 조건에서 좋은 결과를 보여줬다는 데이터가 쌓인다면, VR 작업 한정으로는 AMD가 엔비디아보다 우수하다는 평가를 들을 수 있어 보인다.
독립적인 AMD 소프트웨어 프로 에디션
AMD 라데온 프로 계열은 일반 게이밍 제품군과 별도로 분리된 ‘프로 에디션’ 소프트웨어를 활용한다. 실제로 아드레날린과 프로 에디션이 호환되지 않으므로 별도로 설치해야 한다.
프로 에디션은 워크스테이션용 프로그램 인증인 ISV 프로그램에 대해 최적화된 지원을 제공하며, 이미지 품질을 최적화하는 라데온 프로 이미지 부스트나 화면 영역의 프레임률 및 탐색도를 올리는 뷰포트 부스트, 제작 및 협업 과정을 돕는 녹화 및 스트리밍 기능도 포함된다. 라데온 프로 라인업을 활용한다면 항상 최신 업데이트를 유지해야 안정적으로 성능을 확보할 수 있다.
100만 원 대 전문가용 그래픽 카드의 새 기준 될까
AMD 라데온 프로 W7700의 입지는 상당히 중요하다. 직전 세대인 W6000 시리즈에서는 없었던 16GB 라인업인 만큼 중간 성능 및 가격대를 찾는 소비자에게 적절한 선택지가 되고, 또 엔비디아의 동급 라인업과 비교해 월등한 가격 경쟁력도 뺴놓을 수 없다. 비슷한 급의 제품으로는 엔비디아 4000 SFF Ada, A4000, A4500, A5000이 있으나 수요 공급 문제로 가격대가 220만 원에서 350만 원대 사이다. 특히 4000번 대는 공식 출시가가 1167달러에서 1308달러 사이임에도 가격은 200만 원대 초반일 정도다.
그런 상황에서 AMD가 중간 라인업의 대체제를 제시한 것이니, 전문가용 그래픽 카드 시장에도 상당한 영향을 미칠 수 있다. 물론 엔비디아가 시장독점적 지위를 갖고 있어서 가격이나 성능 측면에서 의식은 하지 않겠지만, 최소한 경종은 울린 셈이다.
관건은 AMD ROCm 생태계, 그리고 매번 언급되는 호환성 문제다. ROCm의 경우 지난 7월부터 AMD가 윈도우에서도 ROCm을 지원하겠다고 했지만, 아직까지 엔비디아 쿠다 생태계와 비교하기엔 간극이 너무 크다. 또 호환성은 AMD 라데온 대다수가 매번 지적받는 사안인데, 당장 이번 리뷰에서도 라데온 프로 W7900 및 W7800는 공식 지원하는 시네벤치 2024가 W7700에서는 동작하지 않는 모습 등을 보여줬다.
결과적으로 AMD가 예상보다 좋은 하드웨어, 그리고 이를 잘 활용할 수 있는 소프트웨어 환경을 제공해야 점유율을 확보할 수 있을 것이다.
글 / IT동아 남시현 (sh@itdonga.com)