음성인식 인터페이스는 견고함이 중요, 어도비 마크 웹스터 디렉터

이상우 sw@itdonga.com

[IT동아 이상우 기자] 음성인식은 터치 스크린에 이은 다음 세대 주요 인터페이스로 자리잡을 전망이다. 화면을 보거나 만지지 않고, 음성만으로 원하는 정보를 찾을 수 있기 때문에 운전처럼 양 손이나 시야가 자유롭지 않은 상황에서도 쉽게 사용할 수 있다. 단순히 날씨를 확인하거나 뉴스를 물어보는 것을 넘어, 애플리케이션을 실행, 일정 등록처럼 스마트폰 기능을 실행할 수도 있다. 여기에 인공지능을 더하면 온라인 쇼핑몰에서 마치 오프라인 매장 직원과 대화하듯 원하는 상품을 추천 받을 수도 있고, 고객 상담 같은 감정노동자의 업무 역시 대체 가능하다.

음성인식 기능인 구글 어시스턴트를 지원하는
스피커
음성인식 기능인 구글 어시스턴트를 지원하는 스피커

실제로 KB손해보험의 경우 현재 인공지능 챗봇을 통해 진행하던 CS업무를 보이스봇으로 확대할 계획이다. 이러한 음성 기반 서비스의 경우 사용자가 운전 중 스마트폰 화면을 보거나 만지지 않고도 사용할 수 있기 때문에 안전하다.

신세계면세점의 경우 중국 및 한국 사용자를 대상으로 쇼핑 경험 개선을 위해 인공지능 기반 음성인식 서비스를 도입했다. 해당 솔루션을 구축한 마이셀럽스 신지현 대표는 도입 초기에는 대부분의 사용자가 기존 음성인식 서비스 처럼 '빨간 립스틱 찾아줘' 등의 방식으로 상품을 검색했지만, 3개월 정도 지난 시점에서는 '봄날 원피스에 어울리는 립스틱 브랜드 찾아줘' 등으로 자신의 취향을 반영해 대화하듯 상품을 찾게 됐다고 설명했다.

어도비가 선보인 UX 디자인 툴 어도비 XD 역시 이러한 동향을 반영해, 디자이너가 앱이나 서비스를 디자인하는 과정에서 음성인식 기능을 넣어 테스트 할 수 있도록 지원한다. 특히 개발자의 도움 없이, 디자인 도구만으로 이러한 기능을 탑재한 프로토타입을 제작할 수 있어 짧은 시간안에 더 많은 시도와 개선이 가능하다.

이처럼 음성인식은 스마트폰 처럼 우리 일상에서 사용하는 제품부터 시작해 TV나 냉장고 같은 가전제품 까지 다양한 영역에 적용돼 쓰일 것으로 보인다. 어도비 마크 웹스터 음성 기반 UI/UX 디렉터는 "음성 기반 인터페이스는 사용자의 디지털 경험에 있어서 가장 주목 받는 분야로, 미래에는 어떤 화면이든 음성으로 조작할 수 있는 세상이 올 것이다"고 말했다.

어도비 마크 웹스터 디렉터
어도비 마크 웹스터 디렉터

또, "휴대폰이 처음 등장했을 때 걸으면서 통화하는 사람이 마치 혼자 말하는 것처럼 보여 어색했지만, 지금은 그렇지 않다. 음성인식 역시 새로운 기술인 만큼 사용하는 데 어색함이 있을 수 있지만, 습관이 되면 자연스럽게 사용할 수 있을 것이다"고 말했다.

그는 현재는 어색함 때문에 사용을 꺼려할 수 있지만, 미래에는 음성인식이 얼마나 견고하게 설계돼 있는지를 더 중요하게 여길 것으로 내다봤다. 예를 들어 목소리나 말의 맥락을 제대로 인식하지 못한다면 사용자가 반복해서 말해야 하고, 이러한 경험이 반복되면 결국 기술에 대한 신뢰도가 떨어져 사용하지 않게 된다는 설명이다.

마크 웹스터 디렉터는 "때문에 사용자가 믿고 사용할 수 있는 설계가 필요하다. 우리는 부정확한 발음이나 사투리 등도 이해할 수 있도록 마이크로소프트의 STT(Speech to Text) 기술과 아마존의 TTS(Text to Speech) 기술을 어도비 XD에 적용해 이러한 견고함을 확보하고 있으며, 향후에는 음성인식 인터페이스를 디자인하는 것을 넘어 어도비 XD 자체를 음성인식으로 사용할 수 있도록 툴을 강화할 계획이다"고 말했다.

글 / IT동아 이상우(lswoo@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.