AMD 개발자들이 말하는 '라이젠 9000ㆍ라이젠 AI 300' 이야기

강형석 redbk@itdonga.com

AMD 엔지니어 세 명이 제품 개발에 대해 이야기 하는 자리가 마련됐다. 조 매크리 AMD 기업 연구원 및 컴퓨팅ㆍ그래픽스 부문 최고기술책임자(좌측)가 진행을 맡았다. / 출처=IT동아
AMD 엔지니어 세 명이 제품 개발에 대해 이야기 하는 자리가 마련됐다. 조 매크리 AMD 기업 연구원 및 컴퓨팅ㆍ그래픽스 부문 최고기술책임자(좌측)가 진행을 맡았다. / 출처=IT동아

[IT동아 강형석 기자] 2024년 7월 9일(미국 현지 시각), AMD는 미국 로스앤젤레스 웨스틴 보나벤처 호텔에서 ‘테크데이(Tech Day)’를 개최하고 차세대 라이젠(Ryzen) 프로세서를 공개했다. 공개된 제품은 데스크톱용 중앙처리장치(CPU) 라이젠 9000 시리즈와 노트북용 가속처리장치(APU) 라이젠 AI 300 시리즈 두 가지. 큰 변화는 성능 향상과 전력 효율성이 개선이다. 더 많은 데이터가 이동할 수 있게 설계된 5세대 젠(Zen 5)을 적용하고 칩의 소재도 손봤다.

테크데이에서는 Zen 5 설계를 주도한 4명의 엔지니어를 중심으로 좌담회가 진행됐다. 이들은 제품 개발 비화부터 적용된 기술들, 플랫폼의 방향성 등 여러 이야기를 주고받았다. 아래는 좌담회 내용을 일부 정리한 것이다.

5세대 Zen 설계는 전 세계 개발자들의 노력이 만든 결과물

조 매크리 (Joe Macri) AMD 기업 연구원 및 컴퓨팅ㆍ그래픽스 부문 최고기술책임자 : 그래나이트 릿지(Granite Ridge – 라이젠 9000 시리즈)와 스트릭스 포인트(Strix Point – 라이젠 AI 300)는 AMD가 4년 이상 연구해 온 결과물입니다. 우리는 제품을 출시할 때마다 아기를 안고 우주로 향하는 느낌을 받아요. 그만큼 설레는 일입니다. AMD는 전 세계 엔지니어링 관련 인력을 2만여 명 이상 보유하고 있습니다. 그리고 그들과 함께 24시간 내내 개발이 이뤄지고 있죠. 이 중 2% 정도의 인원이 연구원 커뮤니티로 활동합니다. 이들은 실제 제품을 설계하고 출시에 영향을 주는 리더들입니다. 이 자리에 나올 3명의 개발자도 그렇고요.

먼저 마이크 클라크는 AMD에서 12~13년 정도 일했습니다. CPU 로직 기술 전문이죠. 젠(Zen)의 아버지이기도 합니다. 1세대부터 지금까지 모든 개발에 참여했으니까요. 윌 해리스는 플랫폼 엔지니어링 그룹의 수석 설계자 중 한 명입니다. 플랫폼은 모든 기술이 실제로 구현되는 기틀이 되죠. 마헤쉬 수브라모니는 시스템-온-칩(SoC) 설계 팀에 있습니다. AMD의 모든 SoC가 그의 손을 거쳤어요. 아시겠지만 AMD는 중앙처리장치(CPU)부터 그래픽 처리장치(GPU), 신경망 처리장치(NPU) 모두 만듭니다. 그리고 이것을 하나로 합치는 중이죠. 구동은 플랫폼 위에서 이뤄지고요. 세 사람은 지금을 위해 4년간 협력했습니다.

x86 설계만 30년 이상 해 온 마이크 클라크 AMD 기업 연구원ㆍ실리콘 디자인 엔지니어(좌측 두 번째). / 출처=IT동아
x86 설계만 30년 이상 해 온 마이크 클라크 AMD 기업 연구원ㆍ실리콘 디자인 엔지니어(좌측 두 번째). / 출처=IT동아

조 매크리 : 우선 마이크에게 묻습니다. 실제로 5세대 젠(이하 Zen 5) 설계 구조를 완성했는지 이야기를 시작할 건데요. 먼저 Zen 5 엔지니어링 팀에 대한 설명을 들어볼까요?

마이크 클라크(Mike Clark) AMD 기업 연구원ㆍ실리콘 디자인 엔지니어 : 사람들은 우리가 제품 하나를 개발하는 데 얼마나 열심히, 오래 수행하는지 모릅니다. 매번 새 프로젝트를 진행할 때마다 신체적으로, 정신적으로, 감정적으로 힘들어요. 그러나 프로젝트를 마친 후 전 세계 사람들이 열광하는 것을 보면 매번 놀랍니다. 이게 내가 원하는 것이고 앞으로도 계속하고 싶어요.

엔지니어링 팀에 대한 이야기를 해야죠. AMD는 여러 국가에 설계자를 위한 사무실을 마련했습니다. 산타클라라에 있고 저는 오스틴에서 출퇴근합니다. 이 외에도 포트콜린스와 인도에도 사무실이 있어요. 보스턴 디자인 사이트에서도 인력이 있습니다. 이번 프로젝트는 개발 일정이 다소 빠듯해 보스턴 디자인 사이트의 도움을 많이 받았어요. 반도체 검증은 루마니아에서 했습니다. 캠브리지 리서치도 잊으면 안 되겠군요. Zen 5를 완성하기 위해 수많은 연구원의 손을 거쳤습니다.

데스크톱과 모바일, 두 환경이 요구하는 것은 다르다

조 매크리 : 좋아요. 그럼 이번에는 마헤쉬에게 물어볼게요. 우리의 경쟁사죠. 인텔에는 성능 지향 제품부터 경제적인 제품 등 여러 선택지가 있잖아요? 잘 보면 데스크톱이나 모바일 분야에 어떻게 접근했는지 다른 철학을 볼 수 있어요. 물론 우리에게는 이기종(Heterogeneous) 제품이 있죠. 여기서 궁금한 것은 같은 시장에 있는 두 기업이 다른 방향으로 가는 이유 아닐까요?

마헤쉬 수브라모니(Mahesh Subramony) AMD 수석 연구원ㆍ실리콘 디자인 엔지니어 : SoC 설계는 사용자가 실제 우리 제품을 경험할 때 무엇을 시도할 수 있는지 생각해야 됩니다. 소비자 요구에 부응해야죠. 칩렛부터 이기종 코어 설계 등 기술을 위한 기술은 우리가 추구하는 게 아닙니다. 사용자 경험을 극대화할 수 있는 부분, 데스크톱과 모바일 SoC에 필요한 부분이 다르다 보고 있어요. 우리는 무엇이 사용자를 감동시키는지 이해하고 있습니다.

예를 들죠. 명령어 집합체(ISA)를 클럭당 처리하는 모듈식 마이크로 설계에서 속도와 전압은 관련이 많습니다. 속도를 최대한 높여도 결국 성능과 괴리감이 생겨요. 우리는 이를 보완하기 위해 소형 코어를 추가합니다. 데스크톱 사용자는 모든 작업이 빨리 처리되기를 원합니다. 그래서 더 나은 성능을 제공하기 위해 전압과 작동속도 향상을 위한 코어를 적용하는 게 유리하죠. 모바일 PC는 전력 효율성에 관심이 많아요. 여기에는 작은 코어가 적합합니다. 기존 코어와 소형 코어는 전력 효율과 성능 확장성을 제공한다고 봅니다. 하지만 우리는 다른 방법이 나오지 않을까 생각합니다.

플랫폼은 기술에 따라 제공할 것

조 매크리 : 우리는 클럭당 명령어 처리에 집중한 마이크로 설계이기에 사용자 관점에서 보면 작업이 빨라집니다. 속성이 매우 다른 코어가 있으면, 특수한 환경에서 사용자를 혼란스럽게 만들죠. 이는 경험을 저하시키고 운영체제 및 소프트웨어 관계사를 힘들게 만들 겁니다.

우리는 데스크톱의 성능 잠재력과 노트북의 높은 저전력ㆍ고성능 솔루션 등 두 가지 분야에서 최고라고 생각합니다. AMD 엔지니어링 팀은 늘 사용자를 위해 노력하고 있습니다. CPU 마이크로 설계에는 진화의 여지가 아직 많으니까요.

자, 이제 다른 분에게 물어볼게요. 윌? 우리가 약 6~7년 정도 AM4 플랫폼을 유지하다가 AM5 플랫폼으로 변경했어요. 이건 쉬운 일이 아니죠. 그에 대한 설명을 할 수 있나요?

윌 해리스(Will Harris) AMD 연구원ㆍ플랫폼 및 시스템 설계 담당 : 맞아요. 매우 어려운 일이죠. 오래 사용 가능한 플랫폼은 사용자들에게 중요한 부분일 겁니다. 우리가 AM4와 AM5 등 플랫폼을 설계할 때 먼저 하는 일이 전환 중인 주요 연결 기술(인터페이스)의 적용 여부입니다. AM4는 DDR4, AM5는 DDR5 메모리를 씁니다. PCI-E도 시간이 지남에 따라 속도와 개선도 이뤄졌고요.

이 외에 우리는 기술을 평가하는 일도 합니다. 업계 동향부터 표준 기술에 대해 외부 공급업체와 협력하죠. 기술이 어떤 방향으로 가고 있는지, 미래에 어떤 일이 생길지 확인합니다. 이런 부분을 차세대에 적용할 수도 있을 겁니다. 이런 부분들 때문에 새 CPU가 플랫폼에 적합하게 설계되었는지 확인하는 일은 정말 어렵지만, 가치 있다고 생각합니다. 우리 일이기도 하고요.

AMD는 SMT 기술을 포기하지 않는다

조 매크리 : 자, 다음 이야기로 넘어가죠. 다시 한번 말하지만, 우리와 인텔은 하드웨어 접근 방식에 차이점이 있을 겁니다. 그런데 인텔이 차기 제품에서 논리 코어 기술(하이퍼스레딩)을 쓰지 않을 것이라고 발표했죠. 이에 대해 이야기해 볼 수 있을까요? 마헤쉬. 당신은 AMD CPU에 적용 중인 동시 다중스레딩(Simultaneous Multithreading - SMT)에 대해 어떻게 생각해요?

마헤쉬 수브라모니 AMD 수석 연구원ㆍ실리콘 디자인 엔지니어(우측)가 자사 마이크로 설계에 대해 이야기하고 있다. / 출처=IT동아
마헤쉬 수브라모니 AMD 수석 연구원ㆍ실리콘 디자인 엔지니어(우측)가 자사 마이크로 설계에 대해 이야기하고 있다. / 출처=IT동아

마헤쉬 수브라모니 : 앞서 이기종 구조에 대해 이야기했는데요. 인텔 제품에는 SMT가 적용된 코어와 그렇지 않은 코어가 혼재되어 있죠. 소프트웨어 관리가 어렵기 때문에 그렇게 할 수 있겠다 생각이 듭니다. 인텔의 선택에 대해 더 이야기할 수 없지만, 중요한 것은 AMD의 SMT 기술은 최고의 면적당 와트당 성능을 제공한다는 것이죠.

어제 마크 페이퍼마스터 부사장이 말한 대로 마이크로 설계의 CPU는 현명한 방법으로 일해야 됩니다. 우리가 적용한 SMT 기술은 전체 영역의 5~10%를 차지하지만, 20~50% 가량 부하를 낮춥니다. 모든 실행 시나리오에 대응한다고 볼 수 없겠지만, 경험은 가능하죠. 스레드 추가 없이 코어만 늘리는 것은 더 이상 도움이 되지 않을 수 있죠. SMT는 원하지 않을 경우 비활성화하면 그만입니다.

성능과 전력관리 모두 최고 수준으로 조율한 스트릭스 포인트

조 매크리 : 이제 다른 이야기를 해볼게요. 마헤쉬. 처음 사용자 요구에 대해 이야기했죠? 당신이 생각하는 스트릭스 포인트(Strix Point – 라이젠 AI 300 시리즈)는 그 요구에 부합할까요? 실제로 이전 제품에 비하면 차이가 있다는 것을 알고 있습니다. 이번 개발 목적과 접근 방식에 대해 설명해 주시죠.

마헤쉬 수브라모니 : 네, 스트릭스 포인트를 궁극의 인공지능 장치로 만들기 위해 많은 시간을 보냈습니다. 정점이라고 말할 수 있어요. 당시 우리는 피닉스와 호크 포인트 SoC를 보유한 상태였죠. 차기 제품을 개발하면서 목표는 특성을 두 배로 올리는 것이었어요. 더 많은 컴퓨팅 성능은 소비자 기대를 충족하는 기본기 중 하나죠. 그래서 우리는 코어를 50% 더 추가했습니다. 예비 저장공간(캐시)도 더 늘렸고요. 많은 코어가 사용자에게 이익이 된다고 확신합니다.

GPU는 일상적인 사용자에게 더 많은 영향을 미치는 장치죠. 33% 증가한 그래픽 코어로 고품질 시각 효과를 제공합니다. 마지막으로 NPU인데요. 새로운 플레이어로 사용자 경험의 핵심으로 꼽습니다. 이번에는 2배 높은 효율성을 제공하게 됐습니다.

중요한 부분은 기존 플랫폼 위에 있다는 점이네요. 동일한 패키지와 플랫폼 인프라를 씁니다. AMD는 제조사에 부담을 주지 않으려고 노력 중입니다. 이를 실현하기 위해 수많은 엔지니어들이 계속 일하고 있습니다.

AMD 플랫폼의 방향성에 대해 설명 중인 윌 해리스(Will Harris) AMD 연구원ㆍ플랫폼 및 시스템 설계 담당(중앙). / 출처=IT동아
AMD 플랫폼의 방향성에 대해 설명 중인 윌 해리스(Will Harris) AMD 연구원ㆍ플랫폼 및 시스템 설계 담당(중앙). / 출처=IT동아

조 매크리 : 저는 스트릭스 포인트가 프로슈머 시장에 적합할 수 있도록 모든 역량을 쏟았다는 것을 압니다. 특히 배터리 지속 시간이 길더라고요. 플랫폼 수준의 전원관리 프레임워크가 중요하다는 것을 알았어요. 그렇다면 스트릭스 포인트 플랫폼이 사용자에게 실제 어떤 영향을 줄 수 있을까요?

윌 해리스 : 맞아요. 스트릭스 포인트는 다릅니다. 우리는 전력관리 프레임워크를 기존과 다른 방법으로 접근했어요. 시스템을 가장 빠르고 많이 실행하는 것보다 사용자를 최종 인식하고 실제 실행되는 형태로 최적화했습니다. 그렇게 하니까 만졌을 때 뜨겁지 않고 조용하기까지 합니다. 단순히 성능만 높이는 게 아니라 과거 경험을 중심으로 최적화하면 더 나은 사용자 경험을 제공할 수 있어요.

조 매크리 : 어젯밤에 ARM 관련 질문을 적어도 다섯 번 정도 받은 것 같아요. 그렇죠? 아무래도 ARM 제품은 x86 대비 전력 소모가 낮죠. 하지만 차이는 있을 겁니다. 아마 이 질문에 대답할 수 있는 사람은 마이크 같아요. 당신이 x86 전문가지만, ARM을 오래 연구했다는 사실을 알고 있으니까요.

마이크 클라크 : 글쎄요 조. 아니라고 말하지는 않을게요. 제가 약 31년간 x86 설계 작업을 했기 때문에 제가 둘을 비교하면 아마 x86에 대한 고집이 있다고 생각할 겁니다. 그런데 수년에 걸쳐 ARM 설계를 연구한 경험을 보면 둘은 명령어 집합 체계부터 달라요. x86은 고정 길이의 명령어와 가변 길이 명령어가 있다는 것이죠. ARM은 아니고요.

저는 클럭당 명령어 처리, 작동속도, 전력 소모, 작동 부하 등 네 가지를 성능의 바퀴라고 부릅니다. 서로 상쇄되는 부분이 있어 이를 잘 조정하는 게 중요해요. 낮은 작동속도로 높은 IPC를 구현하기 어렵겠죠. 더 많은 코어를 넣으면 덩치는 커지고요. 작동속도가 중요하다면 전력을 약간 높이는 게 클럭당 명령어 처리에 유리합니다. x86도 마이크로 설계 속성을 잘 조율하면 무엇이든 구축 가능합니다.

마헤쉬 수브라모니 : 첨언하자면 유휴 상태에서의 전력 소모에도 관심을 가져야 됩니다. 아무것도 하지 않는 게 실제로 더 힘든 일이니까요. 작동 상태에서는 효율 관리가 필요합니다. 비트당 성능, 와트당 성능, 메모리 관리 등 일반적인 작동 상황에서 말이죠. NPU의 활용도 중요합니다. 이들을 잘 관리하려면 지능형 전원관리 기술이 있어야 됩니다.

우리는 전압과 작동속도에 대한 알고리즘을 바탕으로 컴퓨팅 엔진을 관리하는 능동적 전원관리 체계를 갖추고 있어요. 사용자가 원하는 성능에 따라 필요한 반응성을 제공합니다. 그리고 전력 차단이 필요하다면 독립 차단도 가능하죠. 우리는 변화에 집중했습니다.

글 / IT동아 강형석 (redbk@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.