"퓨리오사AI의 개발 철학, 핵심은 하드웨어·소프트웨어의 유기적 결합입니다"

남시현 sh@itdonga.com

[IT동아 남시현 기자]

“최고의 소프트웨어는 최고의 하드웨어에서 나온다”

퓨리오사AI의 박준영 시니어 하드웨어 아키텍트가 항상 마음에 담아두고 있는 말이라고 한다. 퓨리오사AI는 인공지능 연산에 최적화된 인공신경망 반도체(NPU) 기업으로, 현재 1세대 반도체인 ‘워보이(WARBOY)’를 양산하고 내년 초 2세대 반도체인 ‘레니게이드(Renegade)’ 출시를 앞두고 있다. 박준영 아키텍트는 2021년 퓨리오사AI의 하드웨어 팀으로 합류해 레니게이드의 아키텍처를 설계했고, 차세대 반도체 구상에도 참여하고 있다.

퓨리오사AI 박준영 시니어 하드웨어 아키텍트 / 출처=IT동아
퓨리오사AI 박준영 시니어 하드웨어 아키텍트 / 출처=IT동아

아키텍트(Architect)란 건축물을 설계하고 시공하는 건축가를 뜻하는 말로, IT업계에서는 시스템을 기획, 설계, 관리, 감독하는 직책을 의미한다. 그중에서도 AI 반도체 분야의 하드웨어 아키텍트는 반도체의 중추인 NPU의 코어를 설계하고, 시스템온칩(SoC)과 인터페이스 구성 등의 물리적 구성 요소를 조율하고 소프트웨어, 컴파일링 등 무형의 자산까지 효율적으로 적용할 수 있도록 구성하는 일을 한다. 박준영 아키텍트에게 AI 반도체란 무엇인지, 아키텍트가 어떤 역할을 하는지 들어보는 시간을 가졌다.

“시스템 반도체 만들겠다는 꿈, 퓨리오사AI에서 실현하고 있다”

박준영 아키텍트는 NPU 시스템 전반에 대한 설계부터 하드웨어, 소프트웨어 팀을 조율하는 역할까지 하고 있다 / 출처=IT동아
박준영 아키텍트는 NPU 시스템 전반에 대한 설계부터 하드웨어, 소프트웨어 팀을 조율하는 역할까지 하고 있다 / 출처=IT동아

박준영 아키텍트가 퓨리오사AI에서 일하게 된 계기는 어린 시절 만져본 그래픽 카드로부터 시작한다. 그는 “어린 시절부터 컴퓨터에 관심이 많았고 그래픽 카드를 써보면서 언젠가 GPU를 만들어보고 싶다는 꿈을 갖게 됐다. 그래서 전자공학과 컴퓨터공학을 복수전공 하고, 삼성전자 시스템 LSI 사업부에 입사해 시스템 반도체 등과 관련된 설계부터 애플리케이션 프로세서(AP)에 탑재되는 GPU 설계팀까지 일하며 꿈을 이뤄왔다”라며 설명을 시작했다.

이어서 “직무와 관련해 인공지능(이하 AI) 관련 교육을 받는 중, AI 연구에 엔비디아를 비롯한 기업들의 하드웨어가 필수라는 점을 알게 됐다. 그때부터 AI 기반 산업이 세상을 바꿔놓을 것이고, 글로벌 AI 생태계에 합류하고 싶다는 생각을 갖게 됐다. 그러던 중 우연찮게 퓨리오사AI에 근무하는 후배를 통해 대표님과 만나게 되면서 확신을 갖고 합류했다”라고 말했다. 대기업에서 스타트업으로 이직하는 것을 두고 끊임없이 고민했으나, 많은 업계의 인연들과 퓨리오사AI의 방향성에 대한 확신을 갖고 NPU 아키텍트라는 길을 택했다고 한다.

하드웨어 팀과 소프트웨어 팀이 시스템 구성을 위한 회의를 진행하고 있다 / 출처=IT동아
하드웨어 팀과 소프트웨어 팀이 시스템 구성을 위한 회의를 진행하고 있다 / 출처=IT동아

하드웨어 팀의 구성은 어떨까? 박준영 아키텍트는 “하드웨어 팀은 NPU를 비롯한 시스템 전반의 요소를 설계하는 아키텍처 팀, NPU와 다른 하드웨어 구성 요소를 통합하여 하나의 칩으로 설계하는 시스템 온 칩(SoC) 팀, 하드웨어 설계 검증 팀, 메모리 및 인터페이스 팀, 칩 외적인 부분을 맡는 시스템 팀으로 나뉜다. 아키텍트 팀은 하드웨어 팀은 물론 소프트웨어 팀과도 협업하며, 이런 전반적인 영역을 모두 파악하고 시스템을 설계하는 역할을 한다”라고 말했다.

아키텍트 팀의 ‘설계’는 구체적으로 어떤 일일까? 박준영 아키텍트에게 예시를 부탁했다. “반도체는 어떤 목적을 수행하기 위해 만든다. 예를 들어 GPT와 같은 대형언어모델용 반도체를 만든다면, 서비스를 위해 사용되는 매개변수의 양과 사용된 시간을 파악하고, 여기에 필요한 메모리 성능과 초당 연산량 등의요구 사항을 구체적으로 정의해야 한다. 그다음 이를 달성하기 위한 하드웨어를 구성하고 소프트웨어가 사용할 수 있는 구조를 만들어야 한다. 아키텍처 팀이 그 중심에서 작업을 조율하고 제품과 절차를 설계한다”라고 설명했다.

퓨리오사AI의 NPU는 어떻게 엔비디아의 GPU에 맞설까

퓨리오사AI가 주목받는 이유는 AI 산업의 성장세와 밀접한 관련이 있다. 챗GPT의 흥행 덕분에 AI 반도체가 기업 및 연구기관의 핵심 자산으로 떠오르기 시작했고, 엔비디아의 GPU가 품귀현상을 빚고 있다. 하지만 엔비디아의 점유율이 80~90%에 달하고, 사실상 가격을 통제하고 있어서 대체제에 대한 목소리가 커지고 있다. 퓨리오사AI의 NPU가 그 역할을 할 수 있다. 박준영 아키텍트에게 퓨리오사AI의 NPU가 어떻게 GPU를 대체할 수 있을지 물어봤다.

박준영 아키텍트는 NPU와 GPU의 목적은 같지만, 효율성 측면에서 다르다고 설명했다 / 출처=IT동아
박준영 아키텍트는 NPU와 GPU의 목적은 같지만, 효율성 측면에서 다르다고 설명했다 / 출처=IT동아

박준영 아키텍트는 “엔비디아의 GPU는 그래픽 픽셀을 병렬로 처리하는 반도체인데, 이 병렬 연산 기능을 일반 작업 용도로 확장하면서 AI 반도체로 쓰게 됐다. 하지만 AI 작업은 예측 가능한 목표를 수학적으로 처리하는 과정이어서 GPU로 처리할 수는 있지만, GPU 기능을 가장 효율적으로 쓰는 것은 아니므로 전력 사용이나 자원 활용에 있어서 비효율적이기도 하다. NPU는 AI 개발에 필요한 과정에 맞춰 최적화된 반도체로, 필요한 자원만 활용해 데이터를 처리하는 식으로 동작한다. 덕분에 하드웨어 가용량이나 소비전력, 메모리 등을 관리하는데 훨씬 효과적이다”라고 말했다.

그는 “GPU와 NPU의 작업 과정을 쉽게 얘기하면 우주 탐험과 비슷하다. GPU는 우주탐사선과 같아서 다양한 목적을 수행하기 위한 자원과 에너지를 풍부하게 갖고 시작한다. 비용은 많이 들어도 어떤 경로로든 자유롭게 이동하는 식으로 목적을 달성한다. NPU는 탐사선이 개척한 경로를 효율적으로 운항하는데 최적화된 쾌속선과 같다. 정해진 목적을 수행하므로 자원과 에너지를 효율화하고 그만큼 비용도 적게 든다. 엔비디아가 시장을 독점하고 있어도 각각의 AI 반도체 기업들이 성장할 수 있는 이유가 이런 개념이다”라고 덧붙였다.

1세대 워보이와 2세대 레니게이드는 어떤 제품인가?

현재 주력 모델인 워보이, 그리고 2세대 NPU인 레니게이드에 대한 설명을 부탁했다. 그는 “워보이는 기초적인 데이터를 처리하는 정수 계산용 반도체(Integer)지만 퓨리오사AI 입장에서는 기술적으로나 상업적으로 큰 의미를 가지는 제품이다. 워보이를 기준으로 소량 생산에서 양산 단계에 접어들었고, 구체적인 제품 가격과 성능을 입증했다. AI 반도체의 스펙을 보면 연산량이나 메모리 대역폭이 얼마냐 하는 문제가 있는데 이것이 구체적인 성능을 보증하는 건 아니다. 하지만 양산 제품이 있으니 이를 실질적으로 증명할 수 있다”라며 설명을 시작했다.

박준영 아키텍트가 1세대 반도체 워보이를 소개하고 있다 / 출처=IT동아
박준영 아키텍트가 1세대 반도체 워보이를 소개하고 있다 / 출처=IT동아

박준영 아키텍트는 “단순히 하드웨어만 만드는 게 전부가 아니다. NPU로 개발을 하려면 여러 컴퓨터 언어로 작동할 수 있게 컴파일을 해야 하고, 여기에 맞는 소프트웨어도 필요하다. 퓨리오사AI는 컴파일러와 소프트웨어가 효율적으로 동작하도록 소프트웨어 개발 도구(SDK)를 비롯한 데이터를 직접 배포하고 있고, 또 해당 부서가 하드웨어 개발에도 관여하고 있다. 이렇게 소프트웨어와 하드웨어가 발을 맞춰 개발하는 게 퓨리오사AI의 핵심 전략이자 개발 철학”이라고 말했다.

실제 서버 상에서 구동되고 있는 워보이 / 출처=IT동아
실제 서버 상에서 구동되고 있는 워보이 / 출처=IT동아

2세대 레니게이드에 대한 설명도 부탁했다. 그는 “레니게이드는 대형언어모델을 위한 개발 도구 중 엔비디아의 그래픽 카드를 대체할 수 있는 대안 중 하나다. NPU의 빠르고 효율적인 데이터 처리와 HBM3 기반의 높은 메모리 성능, 그리고 이를 지원하는 소프트웨어까지 모두 준비하고 있다. 현재 시점에서는 전체 칩 설계가 완료돼 최종 검증 단계에 있고, 다음 달 반도체 공정의 시작을 앞두고 있다”라고 간략하게 말했다. 물론 시제품이 나오면 기대 성능과 실제 성능을 대조하고, 하드웨어를 효율화하는 작업과 소프트웨어와의 조율은 계속 해야 한다고 덧붙였다.

“3세대 NPU 작업 한창··· 미래 수요 예측하고 설계해야”

그가 준비하고 있는 것은 그다음 세대의 NPU다. 박준영 아키텍트는 “레니게이드를 설계하면서 느꼈지만, AI 시장의 변화가 너무 빠르다. 차세대 반도체가 시장 수요에 부합하기 위해서는 현재 기업과 학회에서 연구되고 있는 것들을 파악해서 선반영하고, 장래에 어떤 기능과 서비스가 필요할지 예측해서 설계해야 한다”라고 말했다.

박준영 아키텍트는 반도체를 설계하는 과정이 현재가 아닌 미래를 위한 설계라고 말한다 / 출처=IT동아
박준영 아키텍트는 반도체를 설계하는 과정이 현재가 아닌 미래를 위한 설계라고 말한다 / 출처=IT동아

차세대 반도체가 입지를 다지기 위해서는 지금 유행하는 서비스가 아닌 앞으로 유행할 서비스를 예측해서 설계해야 한다는 말이다. 그러면서 “엔비디아 같은 거대 자본과 조직, 생태계를 갖춘 곳과 경쟁하는 것은 어려운 일이지만, 소프트웨어와 알고리즘 등의 조직과 자유롭게 의사소통하고 빠르게 의사 결정을 내리면서 가능성을 만들어 나가고 있다”라고 말했다.

마지막으로 박준영 아키텍트는 “AI는 거의 모든 첨단기술 분야에서 사용되고, 또 더 널리 쓰이게 될 것이다. 이를 이끌어나가는 생태계에 속해있다는 것만으로도 개인적인 성취이며,훌륭한 동료들과 최고 수준의 경쟁력을 가진 제품을 만들고 있다는 것 자체에 큰 자부심을 느낀다. 더 욕심을 내자면 우리가 앞으로 선보일 결과물들이 원하는 대로 만들어지고, 세계 시장과 인류사에 기록될 제품이 되길 바란다. 퓨리오사AI가 그런 기업이 될 수 있도록 노력하겠다”라고 말했다.

글 / IT동아 남시현 (sh@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.