[뉴스줌인] 카카오가 인공지능 스피커를?

강형석 redbk@itdonga.com

[IT동아 강형석 기자] IT동아 편집부는 하루에만 수십 건 이상의 보도자료를 받는다. 대부분 새로운 제품이나 서비스 출시, 관련 이벤트 소식 등이다. 이에 IT동아는 독자들에게 도움될 수 있는 보도자료 몇 개를 추려 제공하고자 한다. 다만, 기업에서 보내준 보도자료 원문에는 전문 용어, 혹은 해당기업에서만 쓰는 독자적인 용어가 다수 포함되기 마련이다. 이런 용어에 익숙하지 않은 독자를 위해 IT동아는 보도자료를 해설하는 기획기사 '뉴스 줌인'을 준비했다.

출처: 카카오
제목: 카카오, 스마트스피커 '카카오미니' 본 모습 공개

카카오미니 스마트 스피커.
카카오미니 스마트 스피커.

원문: 카카오의 스마트 스피커 카카오미니(Kakao Mini)가 모습을 드러냈다. 카카오는 5일, 카카오미니 소개 영상을 카카오TV의 카카오 공식 채널을 통해 공개했다. 카카오미니는 카카오의 통합 인공지능 플랫폼 카카오 I(아이)의 음성형 엔진(음성인식/합성 기술), 대화형 엔진(자연어처리 기술), 추천형 엔진(빅데이터 및 머신러닝 기반 추천 기술)이 적용된 기기다.

최근 인공지능 스피커들이 연이어 출시되고 있다. 카카오미니 또한 그 중 하나다. 이미 시장에는 SKT의 누구(NUGU), KT 기가지니(GIGA Genie), 네이버 웨이브(WAVE) 외에도 구글 홈(Hone), 아마존 에코(Echo) 등 다양한 인공지능 스피커들이 존재한다.

인공지능 스피커는 기본적으로 명령-인식-실행의 단계를 거치고 그 인식과 실행 과정 사이에 내부적으로 쌓인 정보들을 활용해 사용자 맞춤 서비스를 제공하게 된다. 단순해 보이지만 그 하나하나는 매우 복잡하고 고도화되어 있어야 제대로 된 서비스가 가능하다. 카카오미니는 이를 음성형 엔진과 대화형 엔진, 추천형 엔진으로 분리 또는 연동시켜 운영하는 구조로 풀이된다.

음성형 엔진은 사용자의 말을 인식하는 역할을 담당한다. 그리고 음성을 분석해 어떤 의미인지 구분하게 된다. 대화형 엔진은 그 과정에서 기기와 사용자와의 소통을 담당한다. 그리고 분석된 내용들을 토대로 원하는 결과물를 도출하는 것은 추천형 엔진의 몫이다. 물론 타 음성인식 기반 인공지능 스피커도 비슷한 구조를 갖는다.

카카오는 카카오 아이(I)를 통해 음성인식 및 인공지능(기계학습) 성능을 꾸준히 높이는 중이다. 지난 2014년부터 음성인식 호출을 제한적으로나마 무료로 쓸 수 있는 형태로 서비스를 시작했다. 현재 약 500여 곳에 달하는 기업이 카카오 음성 기술을 활용하고 있다. 분야도 쇼핑, 교육, 의료 등 다양하게 분포되어 있다. 카카오미니는 이렇게 고도화된 기술을 일반 가정 내에서 쓸 수 있도록 개발한 기기인 셈이다.

카카오의 강점인 캐릭터를 활용한 점도
돋보인다.
카카오의 강점인 캐릭터를 활용한 점도 돋보인다.

원문: 영상에 공개된 카카오미니는 이름처럼 작은 사이즈에 주변과 잘 어우러질 수 있는 미니멀하고 친숙한 디자인을 가졌다. 외형에는 패브릭 소재를 사용해 부드럽고 편안한 느낌을 준다. 함께 공개된 카카오프렌즈 피규어는 자석이 달려 있어 카카오미니 상단에 쉽게 부착할 수 있다. 피규어는 스페셜 기프트로 초기 구매자에게 선착순으로 제공된다.

거창한 말들로 가득하지만 간단하게 풀어보면 작은 크기의 스피커에 외부를 직물 소재로 만들었다는 것 정도다. 또한 별도 판매하는 카카오프렌즈 피규어를 상단에 붙이도록 설계했다는 내용도 있다. 초기 구매자에게는 이 피규어를 제공하지만 이후에는 별도 구매해야 한다.

조작은 단순해 보인다. 눈에 띄는 버튼이라고는 총 4개에 불과하고 그 중 2개는 음량 조절에 할당되어 있다. 다른 버튼은 음소거 또는 마이크 비활성화로 추정되고 다른 하나는 전원 버튼이 아닐까 예상된다.

카카오미니에 탑재된 4개의
마이크.
카카오미니에 탑재된 4개의 마이크.

원문: 카카오미니에는 원거리 음성 인식 성능을 갖춘 고성능 마이크 4개가 장착됐다. 4개의 마이크가 발화 방향을 탐지해 음성 인식률을 향상시킨다. 블루투스와 AUX단자로 일반 스피커와 연결할 수 있는 기능도 제공한다. 고사양 프리미엄 스피커를 보유한 이용자들은 카카오미니의 기능을 그대로 이용하면서 음악을 편하게 즐길 수 있다.

음성 인식으로 기기를 작동시켜야 하기에 이를 인식하기 위한 마이크 성능과 배치는 중요하다. 카카오미니는 마이크 4개로 음성인식률을 높였다. 이 마이크는 기기 상단 각 모서리에 1개씩 배치되어 있다. 스피커 주변 어디에서든 말을 하면 척척 알아들을 것으로 예상된다.

블루투스(Bluetooth)와 AUX는 오디오 재생과 외부 장치 연결을 통한 음악 감상에 쓰이는 규격이다. 블루투스는 우선 보유한 스마트 기기 또는 음원 플레이어를 서로 무선으로 연결하기 위한 기술로 쓰인다. 많이 쓰이는 무선 기술이기도 하다.

하지만 AUX가 생소한 사람도 있을지 모르겠다. AUX는 보조, 예비라는 뜻을 가진 의 줄임말이다. 말 그대로 외부 입력을 지원한다는 의미다. 카카오미니는 외부 스피커를 연결해 음원을 출력하도록 만들어져 있다. 음성인식은 카카오미니가 하고 그 결과물을 외부 스피커로 출력하는 구조다. 규격은 일반 3.5mm 단자를 쓴다. 스마트폰에 있는 이어폰 단자와 같다.

원문: 카카오미니는 멜론의 풍부한 음악 데이터베이스와 카카오 I의 추천형 엔진이 만나 사용자의 취향, 기분, 상황에 맞는 음악을 추천해준다. 카카오톡과 연동되어 카카오톡 메시지를 확인하거나 전송할 수 있고, 포털 다음 등 다양한 카카오의 서비스가 연동되어 실생활에서의 이용자 편의를 제공한다. 카카오미니는 자동 업데이트 방식으로 새로운 기능을 반영하며 진화해 나갈 예정이다.

카카오미니는 9월 중 예약 판매를 시작한다. 예약 판매 관련 세부 내용은 카카오 AI 브랜드 사이트를 통해 추후 공개된다.

멜론 서비스도 연동되어 다양한 음원을 카카오미니로 감상할 수 있다. 하지만 멜론 서비스는 유료이기 때문에 이에 대한 대비는 필요하다. 카카오 측에 문의한 결과, 자사가 보유한 서비스를 적극 활용할 수 있는 다양한 방안을 고민하고 있다고. 지금은 사전 공개 단계이고 예약 판매가 이뤄지는 9월 중에 관련 서비스들과 정확한 사양을 알릴 예정이라고 한다. 카카오톡이나 다음 포털 등 카카오가 운영 중인 서비스간 연계도 적극적으로 이뤄질 예정이다.

글 / IT동아 강형석 (redbk@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.