글로벌 AI 반도체 기업 英 그래프코어, 한국 진출

남시현 sh@itdonga.com

그래프코어가 개발한 콜로서스(Colossus)
IPU
그래프코어가 개발한 콜로서스(Colossus) IPU

[IT동아 남시현 기자] 현재 인공지능 개발 분석에는 CPU(중앙 처리 장치)와 GPU(그래픽 처리 장치) 수십~수천 개를 엮은 시스템이 사용된다. 하지만 CPU와 GPU는 어디까지나 일반 컴퓨터 환경용 처리 장치를 다수 엮은 것에 불과해, 인공지능이나 빅데이터 분석에 효율적인 구조는 아니다. 이에 영국의 AI 반도체 전문 기업인 그래프코어(Graphcore)가 인공지능 개발에 최적화된 새로운 연산 처리 장치, IPU(Intelligence Processing Unit, 지능 처리 장치)를 선보였다.

IPU는 CPU, GPU와 전혀 다른 구성으로 설계된 인공지능 개발 전용
반도체다.
IPU는 CPU, GPU와 전혀 다른 구성으로 설계된 인공지능 개발 전용 반도체다.

그래프코어가 개발한 IPU는 CPU나 GPU와 비슷하지만, 설계구조를 인공 지능 분석에 맞게 개선한 장치다. 전통적인 CPU, GPU는 메모리(D램)와 통신하며 연산을 처리한다. 이 과정에서 입력 지연이 발생하고, 통신 속도에도 한계가 있다. 반면 IPU는 칩 내부에 메모리를 배치해 입력 지연을 줄이고, 연산 속도 역시 획기적으로 향상된 것이 특징이다. 말 그대로 인공지능 개발과 기계 학습에 최적화된 컴퓨터 장치다.

그래프코어 코리아 강민우 지사장
그래프코어 코리아 강민우 지사장

2020년 2월 4일, 영국 AI 반도체 기업 그래프코어는 한국 지사 설립을 공식 발표하고, 한국을 비롯한 아시아 시장에 도전할 뜻을 밝혔다. 그래프코어 코리아 강민우 지사장은 “그래프코어 IPU는 기존에 경험해보지 못한 빠른 학습과 추론을 위한 속도를 보장한다.”라며, “국내 기업 고객들의 변화하는 수요에 맞춰 공격적으로 시장을 개척하고, 최적의 제품과 서비스 제공을 위해 조직 확대 및 지원에 적극 나설 예정이다”라는 뜻을 밝혔다.

그래프코어 미국영업 및 비즈니스 총괄 부사장 파브리스
모이잔
그래프코어 미국영업 및 비즈니스 총괄 부사장 파브리스 모이잔

그래프코어 미국영업 및 비즈니스 총괄 부사장 파브리스 모이잔(Fabrice Moizan)은 “기존에 인공지능 연산을 처리하는 CPU와 GPU는 앱/웹이나 그래픽 처리로 성능이 치우쳐 인공 지능 개발에 좋은 조건이라 볼 수 없었다. 이 문제를 해결하기 위해 등장한 IPU는 현재의 CPU 및 GPU 기반으로 개발할 시 겪게 될 여러 문제를 해결할 것이다. 사명이 그래프코어인 이유도, IPU가 그래프 처리에 최적화된 구조(아키텍처)에서 기인했다.”

CPU와 GPU 대신 IPU가 인공지능 개발에 투입된다면 어떤 결과를 보일까? 일단 IPU는 동시에 여러 가지 문제를 처리할 수 있고, GPU보다 더 월등한 연산 속도를 보인다. 동일 단가나 규모로 시스템을 구축할 경우, 지금으로는 상상하기 어려운 결과를 현실로 구현해낼 것이다. 그래프코어의 IPU 성능을 확인하기 위해 현재 GPU로 연산을 처리하고 있는 산업 현장이 예시로 등장했다.

IPU는 인공지능을 활용한 문장 이해 과정에서 최고 성능과 정확도를
발휘했다.
IPU는 인공지능을 활용한 문장 이해 과정에서 최고 성능과 정확도를 발휘했다.

구글이 공개한 인공지능 언어 모델(BERT, Bidirectional Encoder Representations from Transformers)은 인간이 입력하는 데이터를 통해 문장과 문장 간의 관계를 학습하도록 프로그래밍돼있다. 쉽게 말해서 문장이나 단어로 검색하는 문구의 맥락을 기계가 이해하고 최적의 검색 결과를 찾아내는 과정을 인공지능으로 구현한 것이다.

이 인공지능 학습 훈련을 56시간 동안 실행한 결과, IPU 쪽의 추론 처리량이 3배, 대기 시간이 20% 이상 향상됐다. 이를 네이버와 구글 같은 검색 엔진에 반영하게 될 경우, 실질적인 검색 속도와 반응 속도가 훨씬 향상되고, 기업은 수익성으로 투자한 가치를 돌려받게 된다.

확률론 학습 MCMC 기반 모델에서 2시간 걸리는 작업을 4분 30초만에
최적화했다.
확률론 학습 MCMC 기반 모델에서 2시간 걸리는 작업을 4분 30초만에 최적화했다.

데이터 센터나 헬스케어, 금융과 같이 4차 산업 혁명과 밀접한 분야에서도 주목받고 있다. 특히 금융 시장에서 시장 예측을 위해 활용되고 있는 확률론 학습 MCMC(Markov Chain Monte Carlo, 마르코프 연쇄 몬테카를로 방법) 기반 모델에서는 기존 하드웨어보다 약 26배 빠른 처리 속도를 보여주었다. 이는 2시간이 소요되는 작업을 4분 30초 만에 끝낸 것이다. 촌각을 다투는 금융 시장은 물론, 다양한 예측 및 추론이 필요한 산업 현장일수록 더 빨리 보급될 것으로 예상된다.

그래프코어 총괄 부사장 파브리스 모이잔이 콜로서스 IPU를 소개하고
있다.
그래프코어 총괄 부사장 파브리스 모이잔이 콜로서스 IPU를 소개하고 있다.

시간이 갈수록 자연어나 비디오 그래픽 차원에서 처리하는 자료의 총량이 방대해지고 있다. 개인이라면 2~3개의 GPU도 부족함이 없지만, 인공 지능 개발에서 1천 개의 GPU는 하나의 모델을 만들기도 어려운 수량이다. 데이터 센터나 개발 단지 구축에 소요되는 금액과 사업 규모가 거의 비슷하다고 봤을 때, 시간과 금액을 단축할 수 있는 수단을 선택하지 않을 이유가 없다.

물론 IPU라는 개념이 초기 단계이기 때문에, 현재의 CPU나 GPU를 대체하기 보다는 인공지능 개발을 위한 하나의 선택지로 보는 게 좋다. 마이크로소프트 애저(Azure)가 CPU, GPU기반의 인공지능 개발 환경에 그래픽코어의 IPU를 함께 제공하는 이유도, 각각의 잠재력과 활용도 모두 가능성이 있다고 보기 때문이다.

마지막으로 파브리스 모이잔 부대표는 “한국은 일본 포함한 전체 아시아 시장 중에서 가장 혁신적인 국가다. 한국의 기업들은 5G 이동 통신이나 인터넷 속도로 이뤄낸 혁신 만큼 빠르게 발전하고 있다.”라며, “삼성이나 네이버, 카카오, SK같은 혁신 기업들이 앞으로 분명 IPU를 활용한 혁신에도 큰 관심을 가지리라 본다.”고 한국 시장 공략에 대한 자신감을 내비쳤다.

글 / IT동아 남시현 (sh@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.