[구글 넥스트 2018] 인공지능의 민주화? 구글이 오토ML로 이끈다
[샌프란시스코=IT동아 강일용 기자] 현재 기업과 개발자들의 인공지능 개발 방식은 크게 세 가지로 나눌 수 있다. 첫 번째는 데이터 수집 및 분석, 머신러닝, 인공신경망 구축 등 모든 작업을 처음부터 끝까지 직접하는 것이다. 인공지능 기술 역량을 축적하기에는 매우 좋지만 개발 속도가 매우 느려진다는 단점이 있다. 두 번째는 텐서플로, 카페, 토치 등 오픈소스 인공지능 프레임워크를 활용해 인공지능을 개발하는 것이다. 인공지능 개발에 들어가는 시간을 제법 단축할 수 있고, 데이터 가공이나 인공신경망 구축 등 핵심 기술에 대한 노하우도 많이 얻을 수 있어 대학과 연구소를 중심으로 많이 선호받고 있는 방식이다.
세 번째는 구글, 마이크로소프트, 아마존 등이 클라우드 컴퓨팅 서비스를 통해 제공하는 인공지능 API를 적극 활용해 인공지능을 개발하는 것이다. 기술 종속이 일어날 수 있지만, 인공지능 모델을 빠르게 완성해 상용화할 수 있다는 점에서 많은 기업들에게 각광받은 방식이다.
이러한 세 가지 인공지능 개발 방식에 구글이 한 가지를 더 추가했다. 바로 ‘클라우드 오토ML’을 활용해 인공지능을 개발하는 것이다. 오토ML은 인공지능망 강화가 완료된 구글의 인공지능이 전이학습 기술을 이용해 기업 인공지능 모델의 인공신경망을 강화시켜주는 기술이다. 쉽게 말해 인공지능이 인공지능을 가르친다는 뜻. 인공지능을 개발할 때 가장 어려운 분야인 데이터 학습을 통한 인공신경망 강화를 대신 처리해주기 때문에 매우 쉽고 빠르게 인공지능을 개발할 수 있다는 장점이 있다. 오토ML은 인공지능 API를 활용해 인공지능을 개발하는 것보다도 난이도가 낮다. 기업내에 파이썬, R, 텐서플로 등 인공지능 개발에 필요한 고급 프로그래밍 지식을 갖춘 인력이 없어도 인공지능을 개발해 비즈니스에 적용할 수 있다.
24일 미국 샌프란시스코 모스코니센터에서 열린 구글의 클라우드, 인공지능 개발자 컨퍼런스인 ‘넥스트 2018’에서도 시종일관 오토ML이 화제였다. 오토ML의 완성도는 얼마나 되는 것일까? 과연 인간이 간섭하지 않아도 기술이 신기술을 만들어낸다는 기술적 특이점의 시발점이 될 수 있을까? 현장에서 지아 리(Jia Lee) 구글 클라우드 AI R&D 총괄을 만나 자세히 물어봤다. 지아 리 총괄은 구글에 합류하기 앞서 스탠퍼드 의과대학에서 교수를 역임한 후 야후, 스냅챗 등을 거쳐 구글 인공지능 팀에 합류한 인물이다. 현재 다른 인공지능 연구인력들과 협력해 오토ML 개발을 지휘하고 있다.
Q. 클라우드 오토ML이 다른 인공지능 개발 방식보다 뛰어난 점은 무엇인가?
A. 누구나 인공지능을 개발해 바로 비즈니스에 적용할 수 있다는 점이다. ‘Zoological society of London’은 영국의 NGO로, 사내에 IT 관련 인력과 역량이 거의 없는 집단이다. 당연히 인공지능 개발을 위한 머신러닝 경험도 없다. 하지만 오토ML을 활용해 수 주만에 동물 이미지를 분류하는 인공지능 모델을 개발할 수 있었다. 모델을 학습시키는데에는 불과 하루밖에 시간이 걸리지 않았다. 이것이 바로 오토ML이 얼마나 사용하기 쉬운 서비스인지 단적으로 보여주는 사례다.
올해 초 구글이 오토ML을 공개한 후 사용신청을 한 기업이 많았다. 7개월만에 1만 8000개의 기업이 사용신청을 했다. 여기에는 디즈니, 허스트(미국의 매체) 등이 포함되어 있다.
어제 오토ML 자연어처리와 번역을 발표한 후 1400개의 기업이 추가로 사용신청을 했다. 오토ML의 고객들은 매우 다양한 비즈니스 배경을 가지고 있다. 10% 이상이 헬스케어, 라이프사이언스 분야에 종사하는 기업이었고, 소비재, 미디어, 환경보호 등 다양한 업력을 보유한 기업들이 신청서를 냈다. 구글은 고객들이 오토ML을 활용해 더 많은 혁신을 이뤄내길 기대하고 있다.
Q. 기업이 오토ML을 이용하려면 어느 정도의 개발 지식이 필요한가?
A. 거의 필요없다. 기업은 단지 학습시킬 데이터를 준비하고 이를 분류하는 작업만하면 된다. 오토ML은 텍스트 기반의 프로그래밍 환경 대신 그래픽 UI로 편리하게 이용할 수 있다. 여기에 데이터만 업로드하고 학습을 시작한다는 버튼만 누르면 인공지능 개발이 시작된다.
개발이 시작되면 기업은 모델이 얼마나 정확하게 학습을하고 있는지 파악할 수 있고, 학습이 잘못되고 있는 것은 아닌지도 미리 확인할 수 있다.
Q. 오토ML의 사용 비용은 어느 정도인가? 기존 인공지능 API를 활용하는 것과 비교해 어느 정도의 차이가 있나?
A. 두 가지 요금제를 갖추고 있다. 효율적인 학습을 원하는 기업을 위한 요금제와 만들고 있는 인공지능 모델이 제대로 학습되고 있는지 파악할 수 있는 요금제다. 후자가 더 비싸다. 좀 더 자세한 정보는 구글 오토ML 홈페이지에서 확인할 수 있다. 비용은 모두 투명하게 공개되어 있다.
사실 인공지능 개발을 위해 기업에게 가장 좋은 방식은 텐서플로를 적극 활용해 자체 인공지능을 개발하는 것이다. 하지만 이를 위해 개발자, 데이터사이언티스트 등을 고용하고 관련 인프라 비용을 지출한 후 상당 기간을 기다려야 성과가 나온다, 반면 오토ML은 인력 고용이나 인프라 임대에 대한 걱정 없이 비용만 지출하면 바로 인공지능을 만들 수 있다. 선택은 기업의 몫이다.
Q. 현재 오토ML은 컴퓨터 비전(보는 능력), 자연어 처리(읽는 능력), 번역 등에 관련된 인공지능만 개발할 수 있다. 스피치 리코그니션(말하고 듣는 능력) 관련 인공지능을 개발할 수 있는 오토ML 스피치는 언제 출시할 계획인가?
A. 구체적인 일정을 밝히는 것은 곤란하지만, 스피치 리코그니션을 지원하는 오토ML을 선보이는 것도 개발 로드맵에 있다. 조금만 더 기다리면 만나볼 수 있을 것이다.
Q. 기업들은 오토ML을 어떻게 활용하고 있는가?
A. 세 가지 우수 사례가 있다. 오토ML 비전의 경우 켈러 윌리엄스 부동산(Keller Williams Realty)의 사례가 우수 사례다. 고객이 자신이 원하는 형식의 집이나 땅을 적어서 제출하면 오토ML 비전으로 개발된 인공지능이 해당 부동산을 찾아준다 화강암으로 된 베란다가 있는 집도 찾아주고, 실내 장식이 모던한 스타일로 된 집도 찾아준다.
오토ML 자연어의 경우 허스트의 사례가 대표적이다. 허스트는 전 세계에 300개 버전의 뉴스를 공급하고 있다. 오토ML 자연어로 만든 인공지능이 이러한 뉴스를 자동으로 분류해서 정리해주는 서비스를 선보일 수 있었다.
오토ML 번역의 경우 니케이(니혼게이자이신문)의 사례를 주목할 만하다. 니케이는 오토ML 번역을 활용해 의학, 금융 등 경제분야 뉴스 번역에 특화된 인공지능을 만들었다. 특정 분야에 관련된 데이터를 집중학습시켜 매우 수준 높은 번역 기사를 만들어낼 수 있게 되었다.
여기서 중요한 것은 세 기업 모두 기술 기반의 기업이 아니라는 점이다. 기존 산업에 종사하던 기업들도 오토ML을 활용하면 기업 환경에 맞는 인공지능을 빠르게 구축에 현업에 바로 적용할 수 있다.
Q. 오토ML을 이용하는 기업 가운데 한국 기업이 있는가?
A. 고객의 이름을 거론하는 것은 미리 허락을 받아야 하기 때문에 여기서 말해줄 수는 없다. 하지만 1만 8000여개의 기업이 이용 중인 만큼 분명 그 가운데 한국 기업이 섞여있을 것이다. 곧 한국 기업의 오토ML 이용 사례도 만나볼 수 있게 될 것이다.
Q. 오토ML을 만들기 위해 구글에선 얼마나 많은 개발자를 투입했는가?
A. 정확히 몇 명이 투입되었다고 딱 잘라 말하기는 어렵다. 오토ML 개발을 위해 구글 내외의 다양한 인공지능 개발팀이 협력하고 있다고만 말해줄 수 있다. 하지만 구글이 심혈을 기울여 개발중인 서비스인것만은 분명하다. 구글의 목표는 누구나 인공지능을 개발해서 비즈니스 전반을 혁신하는 ‘인공지능의 민주화’다. 오토ML이 충분히 그 시발점이 될 수 있으리라 생각한다.
글 / IT동아 강일용(zero@itdonga.com)