"엄마, 아빠보다 더 친한 '알렉사' "... 음성AI와 정서적 교류 맺는 포스트팬데믹 세대

정연호 hoho@itdonga.com

[IT동아 정연호 기자] 코로나19를 대하는 전 세계의 태도는 ‘전쟁’을 떠올리게 한다. 실제로, 한국 방역당국은 코로나19를 전시상황에 빗대는 표현을 자주 사용했다. 대대적인 대응이 필요한 심각한 상황이란 뜻이다. 전쟁은 태아와 아이들에게 영향을 미친다는 연구 결과가 나오고 있다. 서울대 경제학과 이철희 교수의 연구결과에 따르면, 한국전쟁이 한창이던 1951년 한반도 중부에서 태어난 사람들은 교육 연수가 더 짧고 좋은 직업을 가질 확률도 낮았다. 전쟁만큼 큰 파장을 갖고 오는 전염병의 상황도 다르지 않다. 스페인 독감 대유행 시기에 태어난 아이는 평균적으로 학력이 낮고 더 높은 신체장애 비율을 보였다.

물론, 코로나19가 미칠 영향이 과거의 전쟁, 전염병과 유사한 수준이라고 말하긴 어렵다. 코로나19는 젊은 임산부에게 큰 증상을 유발하지 않으며, 현재는 의료기술이 크게 발달한 상황이다. 또한, 태아의 영양 공급을 걱정하기엔 기술과 경제가 상당히 발전했다. 다만, 분명한 것은 코로나19가 앞으로 모든 세대의 성격을 바꿔나갈 것이란 점이다. 모든 세대가 코로나19의 영향을 받았지만, 나이가 어릴수록 더 크게 영향을 받은 것으로 나타난다. 아이들은 사회화를 시작할 시기에 학교에 가지 않고 줌을 통해 비대면 수업을 받게 됐다. 이에, 아이들이 사회성을 발달시킬 기회를 잃게 됐으며 정서적인 교류도 충분히 나누지 못하고 있다는 지적이 나온다.

코로나19가 본인 삶에 영향을 미쳤다고 생각하는 비율, 출처 맥크린들(McCrindle) 'Understanding the Impact of Covid-19 on the Emerging Generations'
코로나19가 본인 삶에 영향을 미쳤다고 생각하는 비율, 출처 맥크린들(McCrindle) 'Understanding the Impact of Covid-19 on the Emerging Generations'

LG경영연구원은 포스트 팬데믹 시대에 출현할 신세대의 특징을 ‘AI-Native’로 정의했다. 신세대는 어릴 때부터 인공지능(이하 AI)과 친숙하게 소통하고 교감한다. 비즈니스 인사이더는 생후 18개월 된 아이가 처음으로 내뱉은 말이 엄마, 아빠가 아닌 ‘알렉사(Alexa)’였다는 사례를 보도하기도 했다. LG 경영원의 보고서 ‘포스트 팬데믹 시대의 新세대’는 “이들은 AI에 익숙해지는 것뿐 아니라 정서적 관계도 형성한다”면서 “코로나19 시대에 대면 만남이 어려워지는 상황과도 맞물려 어릴수록 오히려 AI 기기와 음성으로 소통하는 것을 더 편하게 여기고, 또 면대면이 아닌 비대면 소통을 기본으로 받아들인다”고 분석했다.

AI 비서는 업무를 빠르게 처리하도록 보조하고, 각종 편의 서비스를 제공하는 것과 같은 비서 역할을 대신한다. 음성 AI는 스마트폰, 스마트 스피커, 스마트TV 등 스마트 기기에 탑재돼, 음성 명령을 인식해 기기를 제어하고 활용하도록 돕는다. 음성 AI는 전자기기를 터치하는 방식보단 직관적이며 편리하게 쓸 수 있지만, 음성 인식률이 떨어진다는 이유로 보급이 더뎠다. 최근엔 기술 발달과 스마트 스피커 판매량이 증가하면서 음성 AI도 빠르게 확산하고 있다. 구글 같은 경우엔 딥러닝(데이터를 통해 패턴을 학습해 이를 토대로 예측이나 의사 결정을 수행하는 기술) 기술로 음성 인식 오류를 줄여, 2013년 80% 미만이던 음성 인식 정확도를 2017년 음성 속기사의 정확도 수준인 95%까지 끌어올렸다.

아마존의 음성 AI 알렉사, 출처=아마존 홈페이지
아마존의 음성 AI 알렉사, 출처=아마존 홈페이지

시장조사기관 스트래티지 애널리틱스에 따르면, 2020년 전 세계 스마트 스피커 판매량은 1억 5천만 대를 넘어서 역대 최고치를 경신했다. 아마존이 28.3% 점유율로 1위, 구글과 애플이 각각 2위 5위를 차지했다. 업계에선 국내에서 판매된 스마트스피커가 천만 대를 넘었다고 추정하고 있다. 코로나19 이후로 집에 머무는 시간이 늘면서 가전제품을 원격으로 조종할 수 있는 편리함, 데이터를 수집해 에너지를 효율적으로 사용하는 경제성을 특징으로 하는 스마트 제품에 관심을 갖는 사람이 늘었다. 최근 인기를 끄는 스마트홈은 이처럼 가전제품을 IoT(사물인터넷)로 연결해 원격으로 관리하는 개념을 말한다. 스마트홈의 IoT 기기를 음성 AI로 제어하는 허브로 꼽히는 게 스마트 스피커다. 때문에, 스마트홈에 대한 관심과 함께 스마트 스피커 판매량도 늘고 있다. 이러한 스마트 스피커를 통해선 음성 AI로 음악 재생, 알람 설정, 날씨 및 교통 정보 확인 등을 할 수 있다.

구글의 음성 AI 구글 어시스턴트, 출처=구글 홈페이지
구글의 음성 AI 구글 어시스턴트, 출처=구글 홈페이지

현재 주요 음성 AI 비서 플랫폼은 아마존 알렉사, 구글 어시스턴트, 애플의 시리(Siri) 등이 있다. 이들은 다른 기업들이 자사의 음성 AI를 활용하도록 해 생태계를 확장하고 있다. 아마존은 알렉사의 개방형 API인 ‘알렉사 스킬’을 발표해, 다른 업체에서도 서비스를 쉽게 활용할 수 있도록 했다. 도미노와 스타벅스가 알렉사를 통해서 주문이 가능하도록 서비스를 연계한 것처럼 말이다. 국내에선 삼성전자의 빅스비(Bixby)가 스마트폰, 태블릿PC, 스마트 워치에 탑재된다. SK텔레콤은 음성 AI인 누구(NUGU)를 출시해 스마트 스피커에 탑재하고 있으며, KT의 스마트 스피커 기가지니(GiGA Genie)에서도 음성 AI를 이용할 수 있다.

애플의 음성 AI 시리, 출처=애플 홈페이지
애플의 음성 AI 시리, 출처=애플 홈페이지

음성 AI 플랫폼들은 스마트TV와 자동차 분야에서 활발하게 쓰이고 있다. 스마트TV에선 음성으로 TV를 켜거나 채널, 볼륨 조작을 할 수 있다. 전 세계 TV 시장 점유율 1위인 삼성전자는 자사의 스마트TV에 빅스비를 탑재했으며, 구글 어시스턴트도 함께 사용할 수 있도록 했다. LG전자도 스마트TV에 음성 AI 서비스인 씽큐와 구글 어시스턴트를 탑재했다. 이들은 스마트TV 음성인식 기능을 추가한 스마트 리모컨을 통해 스마트 TV를 조작할 수 있도록 했다.

최근 출시되는 자동차의 빌트인 커넥티드카(ICT기술과 자동차를 연결시켜 인터넷, 모바일 서비스가 가능한 차량) 시스템에는 아마존 알렉사, 구글 안드로이드가 기본으로 장착되는 모델도 많다. 알렉사나 구글 어시스턴트와 같은 음성 AI를 스마트폰과 연결하지 않고도 이용할 수 있는 것이다. 아우디와 GM의 2020년 이후 모델 차량의 시스템은 아마존 알렉사가 내장된 형태로 출시되고 있으며, 포드, 렉서스, 도요타 카 시스템은 해당 앱을 다운받아 설치하는 형태다. 자동차를 운전하면서 터치 조작을 하는 것은 위험한데, 음성 AI로 음성을 통해 교통정보 확인과 음악 재생, 내비게이션 경로 변경 등의 기능을 쓸 수 있다.

삼정 KPMG의 보고서 ‘음성 AI 시장의 동향과 비즈니스 기회’는 “음성 AI의 거대 시장이 형성되기 위해서는 해결되어야 할 선결 과제가 많다”며 보안과 프라이버시에 대한 대책이 필요하다고 지적했다. 대부분의 스마트 스피커는 거실 혹은 방에 위치하는데, 이를 통해 사용자 음성이 수집될 수 있다는 지적이다. 실제로 아마존이 아마존 에코 스마트 스피커를 통해 사용자 음성명령을 녹음해왔다는 사실이 밝혀져 논란이 되기도 했다. 구글 같은 경우엔 스마트 스피커를 쓸 때 음성 입력 버튼을 눌러야 음성 데이터를 받아들이게 하고 있지만, 스피커 이용 시 매번 버튼을 눌러야 하기 때문에 불편하다는 불만이 나온다.

이어, 보고서는 “보이스 커머스(음성으로 하는 쇼핑)의 보안성 확보와 문맥을 이해하는 기술력 확보도 필요하다. 누군가가 사용자의 음성을 녹음해 보이스 결제에 도용하거나, 해킹을 통한 결제가 일어나지 않도록 방지할 수 있는 장치가 요구된다”고 했다. 또한, “아직도 실제 음성 AI 단말과 서비스를 사용하는 사람들은 여러 불편함을 호소하고 있다. 그중 하나는 문맥을 이해하지 못하는 음성 AI의 한계다”고 분석했다. 여전히 복잡한 문장과 질문을 음성 AI가 이해하지 못해 엉뚱한 명령을 실행하거나 수행 불가능이라고 응답하는 상황이 잦다. 때문에, 음성 AI가 문맥을 정확하게 이해할 수 있도록 기술적인 발전이 필요하단 의미다.

출처=셔터스톡
출처=셔터스톡

LG경영연구원의 보고서 ‘포스트 팬데믹 시대의 新세대’는 “(음성 AI가 학습하는)데이터양이 늘어나고 학습을 거듭할수록 정확도가 향상되는 딥러닝 기술 발달에 힘입어 음성 인식 정확도와 서비스 활용도가 향상되면 음성 인터페이스는 가장 직관적인 커뮤니케이션 수단으로서 다른 세대로 확장될 가능성도 높다”고 전망했다.

글 / IT동아 정연호 (hoho@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.