인공지능은 당신이 잠든 시간에 진화한다, 연합학습

이상우 sw@itdonga.com

[IT동아 이상우 기자] 인공지능에게 학습이란 인간과 유사한 혹은 더 뛰어난 판단을 내리기 위해 사전에 준비해야 하는 하는 필수 과정이다. 인공지능 학습 모델은 인공지능을 가르치는 방식을 말하며, 오늘날 기계학습(머신러닝), 그 중에서도 인공신경망을 기반으로 하는 심층학습(딥러닝) 방식이 많은 주목을 받고 있다. 이를 통해 인공지능은 개와 고양이의 사진을 구분하고, 인간과 바둑 대결에서 승리하기도 했다.

이러한 학습을 위해서는 방대한 데이터를 통한 학습이 필요하다. 인공지능 연구에서 앞서고 있는 구글, 페이스북, 마이크로소프트 등 전세계에 많은 사용자를 갖추고 서비스를 제공하고 있는 기업은 수많은 소비자 접점과 경험 데이터를 바탕으로 인공지능을 학습하고 있다.

구글이 최근 발표한 연합학습(Federated Learning)은 모든 데이터를 서버로 모아, 인공지능을 학습하는 기존 방식과 달리, 사용자가 직접 사용하는 스마트폰에서 데이터를 처리하고 모델을 강화해, 이 모델을 한 곳에 모아 더 정교한 모델을 만들어 다시 배포하는 방식이다.

구글 연합학습의 구조
구글 연합학습의 구조

구글 블레이즈 아게라 이 아카스(Blaise Aguera y Arcas) 수석 과학자(Distinguished Scientist)는 "심층학습이라는 개념은 1959년부터 등장했지만, 최근 크게 주목받는 이유는 컴퓨팅 성능의 비약적인 발전과 데이터 증가 덕분이다. 프로세서의 연산 성능은 지난 몇 년간 빠르게 성장했고, 스마트폰 정도 크기의 기기에서도 데이터를 처리할 수 있게 됐다. 이를 통해 인공지능은 사용자와 더 가까운 곳에서 실시간으로 작동할 수 있다"고 설명했다.

연합학습이 작동하는 과정을 살펴보면, 우선 안드로이드 스마트폰에 탑재된 학습 알고리즘은 개별 사용자의 행동 패턴을 기반으로 꾸준히 학습해 자신의 모델을 강화하고, 사용자에게 더 어울리는 스마트폰 사용 환경을 제공한다. 사용자가 스마트폰에 충전기를 연결하고 잠드는 야간에는 이 모델을 서버로 전송해, 다른 모델과 정보를 공유하며 더 나은 성능을 낼 수 있는 모델로 진화한다. 이 과정에서 사용자의 개인정보가 아닌, 이를 처리하는 모델만을 공유하기 때문에 개인정보 유출 가능성을 제거했다는 설명이다.

구글은 이러한 학습 방식을 학술대회(학회)에 비유했다. 가령 의사가 자신이 경험한 증상이나 치료법 등을 다른 의사와 공유하면, 다른 의사들 역시 이러한 증상의 원인이나 치료법 등을 습득할 수 있다. 또한, 이러한 학회에서 자신이 맡은 환자의 개인정보를 다른 의사와 공유하지 않는 것 처럼 연합학습 역시 자신이 모델을 강화하는데 쓴 사용자 개인정보가 아닌, 모델 자체를 공유한다. 쉽게 말해 사용자가 잠드는 동안, 스마트폰에 탑재된 강화학습 모델이 AI 학회에 다녀온다고 비유할 수 있다. 특히 이러한 작업이 실시간이 아닌, 야간에 이뤄지기 때문에 사용자는 인공지능 관련 작업으로 인해 발생하는 부하를 느끼기 어렵다.

구글 블레이즈 아게라 이 아카스(Blaise Aguera y Arcas) 수석 과학자(Distinguished
Scientist)
구글 블레이즈 아게라 이 아카스(Blaise Aguera y Arcas) 수석 과학자(Distinguished Scientist)

블레이즈 아게라 이 아카스(Blaise Aguera y Arcas) 수석 과학자는 "인공지능은 엄청나게 큰 데이터 세트로 학습을 시작하는 것이 보통이며, 데이터 센터 내에 분산된 인공신경망이 각 데이터를 처리해 중앙 서버로 보낸다. 지금까지 이 과정을 반복하며 모델을 개선하고, 서버를 통해 사용자 스마트폰에 배포하는 방식이었다. 이와 달리 연합학습은 인공신경망을 사용자 개인 디바이스로 분산하는 일종의 엣지 컴퓨팅과 같은 방식이다"고 말했다.

연합학습의 특징은 우선 기업 입장에서는 상대적으로 적은 인프라로도 최적화한 인공지능 모델을 개발할 수 있다. 방대한 데이터를 저장하는 스토리지나 이런 데이터를 처리하기 위한 고성능 프로세서를 사용자 개인 디바이스로 분산했으며, 연합학습 모델에서 개선 사항만을 공유해 최적화한 모델을 다시 배포하는 만큼 트래픽에 대한 부담도 적다. 또한, 개인정보 침해 가능성 역시 적어 제도적 장벽 역시 쉽게 넘을 수 있다.

사용자 입장에서는 더 가까운 곳에서 인공지능 기반 서비스를 이용할 수 있다. 보통 인공지능 서비스는 인터넷에 연결된 스마트폰이 인공지능 데이터센터와 통신하면서 데이터를 처리하고, 이 데이터를 받아와 사용자 스마트폰에서 보여준다. 전체 데이터를 처리하는 속도는 서버가 우수하지만, 네트워크 상태에 따라 지연시간이 발생해 사용자 경험을 저해할 수 있다. 이와 달리, 연합학습은 사용자 스마트폰에서 발생한 데이터로 모델을 강화하고, 이 모델만을 서버에서 모아 최적화한 뒤 다시 스마트폰으로 배포한다. 사용자 스마트폰에서 직접 작동하기 때문에 지연시간이 적으며, 서버에서 새롭게 배포한 모델을 통해 사용자 맞춤형 인공지능 서비스를 제공할 수도 있다.

그는 "이제 고도의 신경망을 사용자 디바이스 단에서 처리할 수 있는 기반이 갖춰졌다. 이를 통해 인공지능은 서비스의 하나로 데이터센터에서 제공하는 것이 아니라, 사람과 가장 가까운 곳에서 실시간으로 작동하는 것이 가능하다. 이를 통해 소비자에게 더 스마트한 스마트폰을 제공할 수 있으며, 우리는 단순한 인공지능 서비스가 아닌, 안드로이드 운영체제 자체를 개선하는 것이 목표다"고 말했다.

글 / IT동아 이상우(lswoo@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.