[리뷰] '합리적 초고성능' 라이젠 스레드리퍼 2970WX

강형석 redbk@itdonga.com

라이젠 스레드리퍼
2970WX.
라이젠 스레드리퍼 2970WX.

[IT동아 강형석 기자] AMD는 2세대 라이젠 스레드리퍼를 공개하며 총 4개 제품군을 출시하겠다고 언급했다. 코어 구성은 12(2920X)/16(2950X)/24(2970WX)/32(2990WX)였다. 이 중 2950X와 2990WX는 지난 8월에 출시되기도 했다. 하지만 두 프로세서는 각 구성에서 최고 사양을 갖추고 있다 보니 상대적으로 가격적 부담이 있었던 것도 사실.

그런 점을 모르는 것이 아니기에 AMD는 재빨리 추가 라인업을 투입하고자 노력했는데, 드디어 지난 10월에 12코어와 24코어를 품은 라이젠 스레드리퍼 2920X와 2970WX를 선보였다. 두 프로세서는 각각 게이머와 전문가 시장을 공략하게 된다.

드디어 12코어부터 36코어까지 풀라인업 완성

12코어부터 32코어까지 AMD는 고성능 데스크탑 프로세서(HEDT – High End Desktop) 라인업을 연내 완성할 것이라는 약속을 지키게 됐다. 소비자 입장에서는 선택의 폭이 넓어졌다. 기존에는 약 200만 원대인 2990WX와 110만 원대인 2950X(모두 최저가 기준) 두 가지만 있었다면 이제는 그 사이에 2970WX와 100만 원대 이하인 2920X도 선택할 수 있기 때문이다.

라이젠 스레드리퍼 2970WX와 2920X의
사양.
라이젠 스레드리퍼 2970WX와 2920X의 사양.

2970WX의 사양을 확인해 보자. 코어 수는 24개에 달한다. 이 제품군의 정점에 있는 2990WX에서 코어가 8개 빠진 형태다. 하지만 캐시나 기타 구성에는 변함이 없다. 코어당 512KB 용량의 2차 캐시(총 12MB) 메모리에 다이 전체에 16MB씩 총 64MB에 달하는 3차 캐시 메모리를 얹었다. 열설계전력(TDP)은 250W로 변함이 없지만 그만큼 프로세서를 다루는데 용이할 것으로 전망된다. 코어 수가 줄어든 만큼 작동 속도가 향상될 여지가 있기 때문.

그러나 기본 작동속도는 2970WX가 3GHz로 2990WX와 동일하다. 최대 작동속도 역시 4.2GHz로 변화가 없다. 아무래도 제품 근간이 앞서 출시된 프로세서와 다르지 않기에 이 같은 수치가 나온 것이라 조심스레 예상해 본다.

2세대 라이젠 프로세서에도 적용한 젠+ 설계로 성능을
높였다.
2세대 라이젠 프로세서에도 적용한 젠+ 설계로 성능을 높였다.

앞서 선보인 두 프로세서와 마찬가지로 2세대 라이젠 스레드리퍼는 젠(ZEN)+ 설계가 적용됐다. 12나노미터(nm) 미세공정이 적용되어 있어 같은 공간에 더 많은 트랜지스터 집적이 가능하다. AMD는 미세공정을 효율성 향상에 썼다. 코어당 명령어 처리(IPC) 개선, 작동속도 향상 등이 대표적이다. 메모리 및 예비공간(캐시) 접근 속도를 줄이는 데에도 총력을 기울였다.

그 결과 2세대 스레드리퍼는 1세대 대비 메모리 지연시간 2%, 1차 캐시 지연시간 8%, 2차 캐시 지연시간 9%, 3차 캐시 지연시간 15% 정도 개선했다. 작동속도는 프로세서에 따라 다르지만 최대 4.4GHz까지 상승하도록 했다.

프리시전 부스트2(Precision Boost2) 기술의
효과
프리시전 부스트2(Precision Boost2) 기술의 효과

기존과 마찬가지로 사용자가 성능을 더 끌어내기 위한 기능을 제공한다. AMD 라이젠 마스터(Ryzen Master)를 활용한 프리시전 부스트(Precision Boost) 2와 프리시전 부스트 오버드라이브(PBO)다.

프리시전 부스트 2는 실제 다중 스레드의 작업 부하에 따라 작동속도를 향상시키는 기술이다. 라이젠 마스터(Ryzen Master) 소프트웨어를 통해 4개의 코어만(4-Core) 또는 모드 코어(All-Core)에 속도 향상이 가능하도록 설정할 수 있다. 설정 및 프로세서의 잠재력 등 여러 요인에 따라 최종 성능 향상에는 차이가 있겠지만 조금이라도 처리 속도를 끌어올릴 수 있기에 긍정적인 부분이라 하겠다.

프리시전 부스트 기술을 쓰면 약간의 오버클럭이 이뤄진 것처럼 속도를 높여 데이터를 처리한다. 예로 3.0GHz가 기본속도라면 이를 조금 더 높여 3.3~3.4GHz 정도로 계속 작동하게 된다. 기본 속도가 높은 제품은 속도 상승 폭이 적을 수 있다. 이미 제조 단계에서 속도를 높였기 때문이다.

라이젠 스레드리퍼 2970WX의 통신 구조.
라이젠 스레드리퍼 2970WX의 통신 구조.

라이젠 스레드리퍼 2970WX는 근본적으로 2990WX와 구조가 같다. 칩 안에 있는 8코어 다이 4개 중 2개에 4코어씩 빠졌다는 것이 다른 점이다. '8+4+8+4' 형태라고 보면 되겠다. 이는 4개의 코어가 하나의 코어 컴플렉스(CCX)로 구성되어서다.

총 4개(0~3번)의 다이 중 0번과 2번이 각각 DDR4 메모리 채널에 접근할 수 있다. 동시에 PCI-익스프레스(Express) 채널에도 접근 가능하다. 하지만 나머지 다이는 접근 권한이 없으며, 그저 각각의 다이와 인피니티 패브릭(Infinity Fabric)으로만 연결되어 있다. 전송 대역은 초당 25GB에 달한다. 하나에 모여 있을 때와 비교하면 상대적으로 아쉬울 수 있어도 부족한 수준은 아니다.

문제는 각각 떨어져 있는 4개의 다이 사이의 통신. 애플리케이션 처리 환경에 따라 각 코어가 제대로 활동하지 않을 가능성 또한 존재하기 때문이다. 이를 어느 정도 해결하기 위해 AMD는 불균일 기억장치 접근(Non-Uniformed Memory Access, NUMA) 기술을 도입했다. 각 코어가 다른 메모리 주소에 접근하도록 도와주고 간섭을 줄이면서 성능을 최대한 확보할 수 있다는 이점이 생긴다.

24코어 프로세서의 성능은?

AMD 라이젠 스레드리퍼 2970WX의 성능을 확인해 볼 차례. 이를 위한 부품은 다음과 같다. 메인보드는 MSI MEG X399 크리에이션, 메모리로 지스킬 플레어X DDR4-3,200(PC4-25600) 32GB(8GB x 4), 그래픽카드는 조텍 지포스 GTX 1070 AMP 익스트림 등이다. 전원공급장치는 마이크로닉스 퍼포먼스2 1,000W, 저장장치는 크루셜 MX300 275GB가 쓰였다.

라이젠 스레드리퍼 2970WX로 시네벤치를 실행하는 모습. 총 48개에 달하는 작업영역이 활발히
움직인다.
라이젠 스레드리퍼 2970WX로 시네벤치를 실행하는 모습. 총 48개에 달하는 작업영역이 활발히 움직인다.

가장 먼저 프로세서의 성능을 측정하는 애플리케이션 중 하나인 시네벤치(Cinebench) R15를 실행했다. 스레드 수에 따라 이미지를 처리하게 되는데, 작은 사각 영역 하나가 해당 이미지를 그려낸다. 라이젠 스레드리퍼 2970WX는 24코어, 48스레드로 총 48개의 사각 영역이 빠르게 작업을 처리해낸다. 2990WX의 64스레드도 인상적이었지만 48개도 충분히 인상적인 모습을 보여준다.

확인해 보니 모든 코어가 작동할 때의 속도는 3.54GHz 가량이다. 2990WX가 3.2GHz 정도로 작동했으니 코어 수가 적은 만큼 속도가 향상됐다고 볼 수 있다. 300MHz 정도면 대규모 다중코어 프로세서 중에서는 제법 큰 차이다. 코어가 많을수록 간섭이 커져 속도를 높이기 어렵다. 발열과 전력 소모 등을 무시할 수 없어서다.

라이젠 스레드리퍼 2970WX의 시네벤치 R15 테스트
결과.
라이젠 스레드리퍼 2970WX의 시네벤치 R15 테스트 결과.

하지만 성능은 확실하다. 결과를 확인해 보니 4,264점을 기록했다. 2990WX가 동일한 환경에서 4,981점을 기록한 것과 비교하면 수긍이 되는 성능이다. 1세대이긴 하지만 8코어 라이젠 7 1700 프로세서의 1,300점과 비교하면 코어 수가 얼마나 높은 효율을 제공하는지 알 수 있다.

라이젠 스레드리퍼 2970WX로 코로나 벤치마크를 실행한
결과.
라이젠 스레드리퍼 2970WX로 코로나 벤치마크를 실행한 결과.

이어서 프로세서의 성능으로 렌더링 작업을 진행하는 코로나(Corona) 벤치마크 애플리케이션도 실행해 봤다. 실행하니 약 1분 2초만에 작업을 마쳤다. 참고로 2990WX는 44초만에 작업을 마무리 지었다. 약 18초 정도의 차이. 하지만 일반적인 4코어 프로세서가 약 3~4분, 성능 좋은 6~8코어 프로세서가 1분 후반대에서 2분 초반대 정도의 성능을 보여준다는 점을 감안하면 충분히 뛰어난 성능이다.

소비자 입장으로 바라보면 비용과 성능 사이에서 고민이 될 것이다. 코어 수에 비례해 성능이 향상되는 것은 아니지만 가격 차이는 비교적 큰 편이다. 선택은 소비자의 몫이지만 1분 1초가 채산성으로 연결된다면 32코어 구성의 2990WX가, 시스템을 대규모로 꾸며 작업 효율성을 높이고자 한다면 2970WX가 상대적으로 유리하다.

라이젠 마스터는 프로세서의 잠재력을 쉽게 끌어낼 수
있다.
라이젠 마스터는 프로세서의 잠재력을 쉽게 끌어낼 수 있다.

라이젠 마스터 애플리케이션은 여전히 유효하다. 설정에 따라 코어 혹은 코어 컴플렉스(CCX) 당 작동 속도를 조절할 수 있으며, 세부 설정이 귀찮다면 능동적으로 속도를 조절하는 프리시전 부스트 오버드라이브(PBO) 등도 사용 가능하다. 성능을 적극적으로 끌어내거나 효율적으로 사용하고자 한다면 반드시 익혀야 할 애플리케이션이다.

사용 환경에 따라 유연하게 코어 수를 활용할 수 있는 모드도 있다. 애플리케이션 하단에 크리에이터(Creator), 게임(Game) 모드가 간단한 아이콘 형태로 제공된다. 이를 선택(클릭)하면 모든 코어를 활용할지, 일부 코어만 활성화해 속도를 높인 채로 쓸지 여부를 결정하게 된다. 세부 설정은 사용자 취향에 따라 직접 등록(프로파일)하도록 만들었다.

'합리적 가성비' 갖춘 초고성능 프로세서

라이젠 스레드리퍼 2990WX도 구성만 놓고 본다면 가성비가 매우 높았다. 북미 가격 기준으로 1,799달러, 우리나라 온라인 최저가 기준으로 208만 원 가량이다. 참고로 경쟁사 동급 프로세서 중 가장 많은 코어를 품은 코어 i9 계열(18코어)만 해도 1,979달러(원화 환산 약 224만 원 상당)이니 더 많은 코어를 제공하면서도 가격은 저렴하다.

라이젠 스레드리퍼
2970WX.
라이젠 스레드리퍼 2970WX.

단순히 처리 가능한 물리적 요소가 많다고 해서 무조건 빠른 것은 아니다. 성능적으로 보면 아쉬운 것이 있는 것도 사실. 이 부분을 파고드는 것이 2970WX다. 32코어가 부담스럽다면 코어 수를 줄여서 가격적 이점을 가져가는 것이다. 아직 국내 가격이 형성되지 않은 상태지만 이 프로세서의 가격은 1,299달러(원화 환산 약 147만 원 상당)다. 약 160만 원 선에서 구매 가능하더라도 이득이다. 잔여 비용으로 추가 부품 구매로 성능이나 확장성을 얼마든지 높일 수 있다.

극복해야 할 것은 그 동안 잃었던 신뢰다. 하지만 이미 소비자 시장에서 라이젠을 통해 비교적 빠르게 신뢰를 회복해 나가는 중이다. 라이젠 스레드리퍼는 그 신뢰를 딛고 실력으로 증명해야되는 막중한 임무를 부여 받았다. 하지만 간단하게나마 확인해 본 2970WX는 그 잠재력이 충분해 보였다. 남은 것은 시장 분위기에 얼마나 잘 대처하는가에 달려 있다.

글 / IT동아 강형석 (redbk@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.