인공지능 비서 한 눈에 이해하기

강일용 zero@itdonga.com

[IT동아 강일용 기자] 내로라하는 글로벌 IT 업체부터 스마트폰 제조사, 이동통신사까지 IT에 한 발 걸치고 있는 업체들이 최근 공들이고 있는 서비스가 있으니, 바로 '인공지능 비서 서비스(Intelligent personal assistant)'다. 애플, 마이크로소프트(MS), 구글, 아마존 등 IT 업계의 빅4가 모두 자신만의 인공지능 비서 서비스를 개발해 상용화를 꾀하고 있다.

하지만 정작 많은 사용자가 인공지능 비서 서비스란 무엇인지, 이것으로 어떤 일을 할 수 있는지 잘 모르고 있다. 올해 사용자 곁에 본격적으로 다가올 인공지능 비서 서비스에 대해 자세히 알아보자.

인공지능 비서 서비스란?

인공지능 비서 서비스란 단어 그대로 인공지능이 개인의 비서 역할을 해주는 서비스를 의미한다. 업무를 더욱 빠르게 처리할 수 있도록 사무 보조를 해주고, 삶의 질을 향상시킬 수 있도록 각종 편의 서비스를 제공하는 것이 비서의 역할. 이를 한 단어로 요약하면 바로 '자동화(알아서 척척)'다. 인공지능 비서는 사람 대신 인공지능이 이러한 자동화 서비스를 제공하는 것이다.

아마존 에코
아마존 에코
<아마존의 인공지능 비서 서비스 '알렉사'를 탑재한 스마트 스피커 '아마존 에코'>

현재 인공지능 비서가 제공하는 서비스는 크게 13가지로 압축할 수 있다. 개인 일정 관리, 소셜 서비스 관리, 외국어 번역, 특정 앱과 서비스 실행하기, 쇼핑하기, 이메일 관리, 메신저 관리, 음악 관리, 날씨 정보 제공, 여행 정보 제공, 스포츠 경기 알림, 궁금한 것 알려주기 및 잡담하기, 사물인터넷 제어 등이다.

개인 일정 관리: 인공지능 비서가 캘린더 앱과 서비스에 입력된 정보를 바탕으로 스마트폰 등의 기기에 알람을 띄워 일정을 차질 없이 진행할 수 있게 도와주는 기능이다. 또, 약속 장소로 이동하는 최적의 방법까지 제시해 약속 시간에 늦지 않도록 돕는 서비스도 함께 제공한다. 최근에는 인공지능이 사용자의 행동 패턴을 분석한 후 사용자가 실수로 캘린더에 기입하지 않은 일정까지 찾아내서 알려주는 서비스도 도입되었다.

소셜 서비스 관리: 인공지능이 사용자의 페이스북, 트위터, 인스타그램에 올라온 글, 사진, 동영상 등을 한 군데 모아서 보여준다. 또, 소셜 서비스 상에서 화제가 되고 있는 글, 사진, 동영상을 찾아주는 기능도 제공한다. 최근에는 인공지능이 사용자의 관심사를 분석한 후 사용자가 흥미로워할 내용을 알아서 찾아주는 기능도 추가되었다.

외국어 번역: 모르는 외국어를 입력하면 이를 사용자가 이용하는 언어로 자동 번역하는 기능을 제공한다. 인공지능 비서가 외국인과 대화할 때 중간에 껴들어 동시 번역을 제공하기도 한다.

특정 앱과 서비스를 실행하기: 사용자가 음성으로 특정 앱과 서비스를 실행하라고 명령하면 이를 기기 속에서 찾아서 자동으로 실행하는 기능을 제공한다. 최근에는 앱과 서비스 실행뿐만 아니라 앱과 서비스의 모든 기능을 음성으로 조작할 수 있는 능력도 갖춰나가고 있다.

쇼핑하기: 인공지능 비서는 사용자가 원하는 물건을 최대한 저렴하게 구매할 수 있도록 쇼핑몰 사이트를 검색해서 최저가를 찾아주는 기능을 제공한다. 또, 음성으로 사용자가 원하는 제품을 찾고 이를 결제해주는 기능도 제공하고 있다.

이메일 관리: 최신 이메일 알람, 이메일 보관함 열람 등 기초적인 기능부터 특정 이메일을 음성으로 읽어주는 기능과 음성으로 이메일을 작성해서 발송하는 고급 기능까지 다양한 이메일 관리 기능을 제공한다. 또, 인공지능이 사용자의 이메일 내용을 분석해 간단한 답장을 자동으로 보내주는 자동 답장 기능도 연구 중이다.

메신저 관리: 카카오톡, 라인, 페이스북 메신저 등 인스턴트 메신저의 내용을 확인하고 이에 대한 답장을 음성으로 보낼 수 있다. 사용자와 친분이 깊은 상대방이 보낸 메시지를 사용자가 바로 인식할 수 있도록 지속적으로 알림을 보내는 기능도 갖추고 있다. 상대방이 사용자와 친분이 얼마나 깊은지는 인공지능이 메시지 분석을 통해 알아서 판단한다.

음악 관리: 인공지능 비서가 사용자의 기기속에 담겨있는 음악 또는 가입한 서비스(예를 들어 스포티파이, 유튜브)에서 제공하는 음악을 통합 관리한다. 이렇게 관리 중인 음악을 음성으로 실행할 수 있고, 특정 시간에 특정 콘셉트의 음악이 자동으로 흘러나오도록 설정할 수도 있다. 예를 들어 아침 7시에는 기상 나팔 소리가, 오후 3시에는 나른한 클래식 음악이 흘러나오게 할 수 있다.

날씨 정보 제공: 사용자가 외출할 때 인공지능 비서가 현재 날씨와 향후 날씨에 관한 정보를 알려준다. 또한 특정 일시에 특정 위치의 날씨가 어떨지 물어보면 이를 음성 또는 비주얼 데이터로 알려주는 기능도 있다.

여행 정보 제공: 인공지능 비서는 여행에 앞서 사용자가 해당 여행지에 관한 정보를 물어보면 이를 찾아주는 기능을 갖추고 있다. 또한 해당 여행지에 빠르고 저렴하게 갈 수 있도록 최적의 교통편을 찾고, 이를 예약해주는 서비스도 제공한다.

스포츠 경기 알림: 인공지능 비서에게 특정 스포츠 팀을 좋아한다고 알려주면, 인공지능 비서가 해당 팀의 경기 일정을 일목요연하게 알려주고 이를 시청할 수 있는 방법을 제안한다.

궁금한 것 알려주기 및 잡담: 인공지능 비서는 사용자가 궁금해하는 것에 대한 답을 인터넷 검색으로 찾아서 알려주는 기능을 갖추고 있다. 또한 각종 상식, 유머, 화제의 UCC 등을 간추려서 보여준다. 또, 사용자와 소소한 잡담을 나눌 정도로 뛰어난 대화 능력을 갖추고 있다.

사물인터넷 제어: 최근들어 인공지능 비서는 사물인터넷 기기를 제어할 수 있는 기능을 적극적으로 품기 시작했다. 기존에는 사용자가 스마트폰 앱 등을 통해 사물인터넷을 직접 제어했다면, 이제는 인공지능 비서가 사용자의 행동 패턴을 분석해 스마트TV, 에어콘, 보일러, CCTV, 냉장고 등의 사물인터넷 기기를 알아서 조작해주고 있다.

현재 인공지능 비서에는 이러한 13가지 핵심 기능 외에도 소소한 기능이 지속적으로 추가되고 있다.

구글 홈
구글 홈
<구글의 인공지능 비서 서비스 '구글 어시스턴트'를 탑재한 구글의 스마트 스피커 '구글 홈'>

인공지능 비서의 종류

인공지능 비서는 크게 두 가지 형태로 나눌 수 있다. 첫 번째는 특정 플랫폼과 운영체제에 종속되어 있는 '플랫폼 관리형 인공지능 비서'다. 특정 플랫폼에서 생성되는 데이터와 실행되는 앱과 서비스를 모두 세밀하게 관리하고 조작할 수 있는 것이 장점이자 특징이다. 다만 특정 플랫폼에 종속되어 있기 때문에 해당 플랫폼 밖에서는 비서 서비스를 이용할 수 없다는 단점이 존재한다. 플랫폼 관리형 인공지능 비서의 대표적인 사례로 애플 시리(iOS 및 맥OS 관리), MS 코타나(윈도우10 관리), 구글 나우(안드로이드 관리) 등을 들 수 있다.

두 번째는 모든 플랫폼과 기기에서 이용할 수 있는 '오픈 API형 인공지능 비서'다. 오픈 API를 활용해 스마트폰, PC, 스마트TV, 스마트 스피커, 스마트 냉장고 등 어떤 플랫폼과 기기에서든 인공지능 비서 서비스를 이용할 수 있는 것이 장점이자 특징이다. API가 공개되어 있기 때문에 어떤 기기이든 손쉽게 인공지능을 접목할 수 있고, 덕분에 사물 인터넷 기기를 제어하는데 주로 활용된다. 다만 특정 플랫폼과 기기의 데이터와 기능에 접근하기 위해 많은 노력이 필요하기 때문에 개발에 어려움이 많은 것이 단점이다. 간단하게 앱 형태로 인공지능 비서 서비스를 제공할 수도 있지만, 이 경우 심도있는 서비스를 제공하는데 어려움이 따른다. 오픈 API형 인공지능 비서의 대표적인 사례로 아마존 알렉사, 구글 어시스턴트 등을 들 수 있다.

사용자 환경으로 인공지능 비서를 구분할 수도 있다. 첫 번째는 사용자와 인공지능 비서가 음성으로 정보를 주고받는 '음성대화형 사용자환경'이다. 두 번째는 사용자의 데이터를 수집해 사용자의 명령을 미리 예측해서 비서 역할을 수행하는 '예측형 사용자환경'이다. 플랫폼 관리형 인공지능 비서는 음성대화형 인공지능과 예측형 인공지능의 특징을 반반씩 갖추고 있거나 예측형 인공지능의 특징만 갖추고 있고, 오픈 API형 인공지능은 음성대화형 사용자환경을 갖추고 있는 경우가 많다.

LG 시그니처
LG 시그니처
<아마존 알렉사를 탑재한 LG전자의 스마트 냉장고 '인스타 뷰'>

인공지능 비서의 원리 및 구조

인공지능 비서의 원리는 뭘까? 인공지능 비서의 원리는 기계학습(머신러닝)과 인공신경망(딥러닝)을 활용하는 다른 인공지능과 동일하다. 먼저 클라우드 데이터 센터 속에 인공신경망을 적용한 기본 인공지능 패키지(모델)를 설치한 후 감독학습과 비감독학습이라는 두 가지 기계학습 기법을 통해 인공지능 비서의 처리 능력과 처리할 수 있는 분야를 확대시킨 것이다.

인공지능 비서는 여기에 한 가지 기능을 더 품고 있다. 사람의 말을 듣고 이를 이해할 수 있는 기능, 바로 '자연어 처리' 기술이다. 인공지능 비서 모델은 기계학습과 인공신경망 기술을 활용해 사람의 말을 듣고 이해할 수 있는 기능을 지속적으로 습득하고 있다. 보다 자연스러운 비서 서비스를 제공하기 위해서다.

인공지능은 모델의 숫자를 늘리고, 기계학습과 인공신경망을 구현하기 위해 막대한 컴퓨팅 파워를 요구한다. 때문에 현재 기술로는 일반 PC에서 인공지능 서비스를 제공하는 것은 불가능하다. 때문에 대규모 컴퓨팅 파워를 보유한 클라우드 데이터 센터나 슈퍼 컴퓨터를 통해 인공지능을 구현하고 있다.

이는 인공지능 비서도 마찬가지다. 인공지능 비서는 각 IT 업체의 클라우드 데이터 속에 담겨 있다. 사용자는 인터넷과 기기를 통해 이에 접속해 인공지능 비서 서비스를 제공받는 것이다. 때문에 인공지능 비서는 인터넷 연결이 반드시 필요하며, 주고받는 데이터도 많은 편이다. 사용자가 보유한 기기의 성능은 인공지능 비서의 성능에 아무런 영향을 미치지 못한다. 때문에 인터넷에만 연결되어 있으면 PC, 노트북, 스마트폰 등 고사양 기기뿐만 아니라 스마트TV, 스마트 스피커, 냉장고 등 상대적으로 성능이 떨어지는 기기에서도 인공지능 비서 서비스를 쾌적하게 이용할 수 있다.

대표적인 인공지능 비서 서비스

현재 상용화된 인공지능 비서 서비스는 어떤 것이 있을까? 대표적으로 '아마존 알렉사', '구글 어시스턴트/구글 나우', 'MS 코타나', '애플 시리' 등을 들 수 있다.

아마존 알렉사는 CES 2017에서 수 많은 기업이 자사의 기기에 탑재하면서 더욱 유명해진 아마존의 인공지능 비서 서비스다. 음성인식형 사용자환경을 통해 TV, 스피커 등 다양한 기기에서 서비스를 이용할 수 있다. 쇼핑, 사물인터넷 제어, 정보 검색 등 인공지능 비서의 핵심 기능을 모두 제공한다. 아마존은 지난해 4월 기업의 제품에 알렉사를 탑재해 사용자가 인공지능 비서 서비스의 혜택을 누릴 수 있게 하는 오픈 API '알렉사 보이스 서비스(AVS)'와 기업의 서비스에 알렉사를 연결해 알렉사에서 음성 명령을 통해 기업의 각종 서비스를 이용할 수 있게 해주는 API '알렉사 스킬즈 키트(ASK)'를 공개하는 등 인공지능 비서 서비스 보급에 앞장서고 있다.

구글 어시스턴트는 아마존 알렉사와 직접적으로 경쟁하기 위해 구글이 개발한 인공지능 비서 서비스다. 때문에 아마존 알렉사와 동일한 기능과 특징을 갖추고 있다. 서비스 발표는 5월, 서비스 출시는 9월(탑재 앱 구글 알로 출시), 11월(탑재 기기 구글 홈 출시)에 걸쳐 점진적으로 이루어졌다. 12월에는 관련 API를 공개해 기업이 자사의 기기와 서비스에 구글 어시스턴트를 적용할 수 있게 했다. API가 알렉사보다 반 년 늦게 공개되었기 때문에 이번 CES 2017에선 구글 어시스턴트를 탑재한 기기를 찾아볼 수 없었다. 올해 5월 열리는 구글 I/O 2017(구글의 개발자 컨퍼런스)에서 구글 어시스턴트를 탑재한 기기가 속속 등장할 것으로 보인다.

구글 나우는 사용자의 데이터와 행동 패턴을 분석해 사용자가 원하는 것(예를 들어 오늘의 날씨, 뉴스, 유머, 교통편, 경기 일정 등)을 미리 제공하는 예측형 사용자 환경이 특징인 인공지능 비서 서비스다. 안드로이드 운영체제와 일체화되어 있기 때문에 안드로이드 기기와 앱을 조작할 수 있는 기능도 보유하고 있다. 최신 안드로이드 스마트폰에서 이용할 수 있다.

MS 코타나는 예측형 사용자 환경과 음성대화형 사용자환경을 모두 갖춘 통합 인공지능 비서 서비스다. 윈도우10, 엑스박스 원 등 MS의 운영체제와 기기에서 이용할 수 있다. 운영체제와 기기를 음성만으로 조작할 수 있는 강력한 음성 인식 능력이 특징. MS는 코타나를 지속적으로 강화해 윈도우10(설치되어 있는 앱 포함)과 엑스박스 원을 마우스, 키보드, 게임 패드 등 컨트롤러 없이 음성만으로 이용할 수 있도록 할 계획이다.

현재 MS는 플랫폼 관리형 인공지능인 코타나를 오픈 API형 인공지능으로 전환해 윈도우10 기기뿐만 아니라 스마트TV, 스마트 스피커, 냉장고 등에서도 코타나를 이용할 수 있도록 준비 중이다. 관련된 발표는 5월 MS의 개발자 컨퍼런스 '빌드 2017'에서 할 것으로 예측된다.

애플 시리는 iOS, 맥OS 등 애플의 운영체제에서 이용할 수 있는 인공지능 비서 서비스다. 비서 서비스 본연의 기능을 충실히 제공한다. 현재 애플은 사물인터넷 제어 서비스 '애플 홈킷'을 시리와 통합하기 위해 준비 중이다. 시리와 애플 홈킷의 통합은 올해 6월 열릴 예정인 애플 WWDC 2017(애플의 개발자 컨퍼런스)에서 공개될 전망이다.

이 다섯 가지 인공지능 비서 서비스 외에도 다양한 인공지능 비서 서비스가 현재 개발 중이며, 상용화를 앞두고 있다. 특히 국내 기업의 약진이 눈에 띈다. 삼성전자는 미국의 인공지능 스타트업 비브(Viv)를 인수해, 이 기술을 바탕으로 개발한 인공지능 비서 서비스 '빅스비'를 차세대 스마트폰에 탑재할 계획이다. 빅스비에 대한 자세한 정보는 아직 공개되지 않았으나, 비브가 개발하던 인공지능의 형태를 볼 때 플랫폼 관리형 인공지능 비서 서비스에 음성인식형 사용자환경을 접목한 것으로 추측된다.

네이버는 음성인식형 사용자환경을 갖춘 오픈 API형 인공지능 비서 서비스인 '아미카' 개발에 심혈을 기울이고 있다. SK텔레콤, KT 등 국내 이동통신사 역시 인공지능 비서 서비스 '누구'와 '지니' 등 인공지능 비서 서비스를 개발 중이다.

글 / IT동아 강일용(zero@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.