일상 속에 들어온 버추얼휴먼, "대체 어디에 쓸 수 있는 거야?"
[IT동아 정연호 기자]
지난 3월, KB국민은행은 ‘버추얼 휴먼’ 제작을 위한 외부 사업자를 모집하겠다고 밝혔다. ‘버추얼 휴먼(가상인간)’은 인공지능과 첨단 그래픽 기술을 기반으로 만든 3D 가상인간을 말한다. 대표적으로 젊은 세대를 중심으로 인기를 끌고 있는 20대 여성의 버추얼 휴먼 ‘로지’가 있다. 로지는 광고계의 블루칩으로 떠오르면서 작년에만 20억 원의 광고 수익을 올렸다. KB국민은행이 제작할 버추얼 휴먼도 앞서 나온 버추얼 휴먼처럼 유튜브와 인스타그램 등에서 활용될 방침이다.
현재 버추얼 휴먼은 크게 두 종류로 나뉜다. 첫째, 실제 사람을 모델로 만든 버추얼 휴먼이다. SM엔터테인먼트의 여성 아이돌 그룹 ‘에스파(Aespa)’는 4명의 멤버들과 멤버들의 이미지를 반영한 아바타 4명으로 구성돼 있다. SM엔터테인먼트는 이러한 아바타를 에스파의 그룹 세계관과 자체 콘텐츠에 활용하고 있다. 둘째, 원본이 없는 상태로 기획자와 개발자가 새롭게 만든 버추얼 휴먼이다. 한국의 로지, 루이, 수아 등이 이 범주에 속한다. 이들은 SNS에서 활동하거나 기업 광고에 주로 등장하고 있는데, 기업 입장에선 버추얼 휴먼을 처음부터 끝까지 통제할 수 있어 브랜딩 구축에 용이하고, 사생활 문제 리스크가 없어 러브콜이 쏟아진다고 한다.
다만, 여전히 버추얼 휴먼의 필요성에 대해선 많은 사람이 의문을 느끼는 게 사실이다. 업계에선 “인공지능이 발전하면서 사람만이 할 수 있던 영역을 대신하게 된 것”이란 말이 나온다. 인간이 가용할 수 있는 자원은 한정적이다. 가령, 하루는 24시간밖에 되지 않는다. 여기서 수면과 식사, 출퇴근 시간 등을 제하면 실제로 쓸 수 있는 시간은 그렇게 많지 않다. 맞벌이 가정의 아이를 생각해보자. 만약, 부모의 외형, 목소리를 그대로 재현한 버추얼 휴먼이 동화책을 읽어주는 등 돌봄을 대신한다면, 아이가 느낄 외로움을 일정 부분 해소할 수 있을 것이다.
기업의 CS(customer service)센터에서도 버추얼 휴먼을 이용하는 것이 가능하다. 이는 인공지능 챗봇이 더 발전한 형태로, 고객에게 일관된 서비스 경험을 제공할 수 있을 것으로 기대된다. 고객 불만에 응대하는 걸 사람이 한다면 담당 직원 역량에 따라서 고객 경험이 달라질 수밖에 없다. 고객 응대에 서툰 직원을 만나면 고객은 불편함을 느끼게 되는 것이다. 때문에, 많은 기업이 인공지능 챗봇을 도입해 표준화된 고객 서비스를 제공하고 있다. 광고 모델을 버추얼 휴먼으로 구현해서 CS센터에 활용한다면 고객과의 최접점에서 표준화된 서비스를 제공하면서도, 기업이 해당 모델을 통해서 추구하는 브랜드를 일관적으로 구축할 수 있게 된다. 금융권에선 오프라인 지점 특색에 맞는 버추얼 휴먼을 제작하는 것을 검토 중인 곳도 있다. 은행이 시골에 있다면, 지점 특색에 맞춰 고객이 친근하게 느낄 수 있는 높은 연령대의 버추얼 휴먼을 만드는 것이다.
업계 관계자들은 “광고주들은 연예인의 사생활 문제가 기업 브랜드로 이어지는 걸 우려한다. 버추얼 휴먼의 경우엔 콘텐츠 제작에 기업이 하나부터 열까지 관여할 수 있어 브랜드 구축에 용이하고, 사생활 문제 자체가 생기지 않아 리스크가 없다”고 전한다. 연예인 광고 모델은 이미지가 빠르게 변한다는 점도 광고계에선 우려되는 지점이었다. 배우라면 새로 맡게 되는 배역에 따라 이미지가 변하기 때문이다. 드라마나 영화에서 범죄자 역할을 하면 그 이미지가 배우를 따라다닌다는 것이다. 다만, 지금 단계에선 버추얼 휴먼은 실용적인 목적보단 마케팅 효과를 위해서 도입되는 경우가 많다.
AI 테크 스타트업 클레온은 버추얼 휴먼 제작 솔루션을 제공하는 기업이다. 가상인간을 새롭게 만들거나, 사람 얼굴을 그대로 재현한 버추얼 휴먼을 제작할 수 있다. 30초 정도의 목소리를 녹음한 파일을 인공지능에게 학습시켜서, 그 사람의 목소리와 억양도 버추얼 휴먼의 음성으로 구현할 수 있다. 스크립트를 작성하면 학습한 인물의 목소리와 억양으로 텍스트를 음성으로 변환한다. 클레온의 강지수 CRO(최고연구책임자)는 “일반적인 콘텐츠는 기획과 촬영, 편집 모두 사람이 한다. 버추얼 휴먼 제작을 인공지능이 함으로써, 제작과 관련된 공수를 크게 줄일 수 있다”고 설명했다.
클레온 솔루션의 강점은 기술에 대한 접근성을 낮췄다는 것이다. 일반적으로 버추얼 휴먼을 제작할 땐 구현할 인물을 1~2달 정도 촬영해서 이 데이터를 인공지능에 학습시킨다. 시간도 오래 걸리고 처리할 데이터양도 많다. 반면, 클레온은 다양한 프리셋을 만들어 두고 인물의 얼굴을 얹는 방식을 택했다. 체형, 인종, 성별별로 특정 모션을 스캔했기 때문에, 적절한 체형과 필요한 모션을 택한 뒤 얼굴만 합성하면 된다는 게 클레온 측의 설명이다. 프리셋 방식의 단점은 버추얼 휴먼이 취할 수 있는 행동이 제한적이라는 것이다. 별도의 요청이 있다면 필요한 모션을 추가로 촬영해 버추얼 휴먼의 행동 폭을 넓히고 있다. 최근엔 아나운서가 큐카드를 들고 걸어오는 등 특유의 언론사 촬영 구도를 추가로 촬영해 프리셋을 확대하기도 했다.
클레온 김성곤 부대표는 “유재석이나 강호동의 초상화를 그린다고 생각해보자. 이들의 얼굴 부분 부분을 세밀하게 구현하면서 얼굴을 채워 나가는 게 경쟁사들의 방식이다. 클레온의 경우엔 사람의 얼굴 구도를 이미 갖고 있다고 생각하면 된다. 사람들의 얼굴 구도는 대부분 유사하다. 거기에 얼굴만 맞춰 넣으면 된다. 버추얼 휴먼에 적용해보면, 사람의 방법론(생김새)을 인공지능에게 학습시킨 개념이다”고 말했다.
이런 특성 덕분에 클레온은 타사 대비 빠른 속도로 버추얼 휴먼을 제작할 수 있다. 버추얼 휴먼을 만드는 데 간단한 영상은 하루, 복잡한 것도 일주일이면 된다. 문제는 속도와 퀄리티를 같이 잡는 것이다. 이 부분이 고객사의 피드백에서 주로 나왔던 얘기다. 속도를 높이려다 보니 버추얼 휴먼의 완성도가 떨어졌다. 김성곤 부대표는 “최근 화질을 개선했고, 이로 인해 고객사들도 타사와 비교할 때 퀄리티적으로 차이가 없다는 얘기를 하고 있다”고 했다. 이어, “외형의 완성도를 우선 높이는 것도 가능하지만, 속도를 높이고 퀄리티까지 같이 잡는 것이 궁극적인 목표”라면서 “시장이 막 시작된 단계라 버추얼 휴먼 제작 속도를 빠르게 해 기술 접근성을 높이는 게 중요하다고 판단했다”고 말했다.
클레온은 이러한 기술을 집약한 버추얼 휴먼 솔루션 '클론'을 5월 말 공식 런칭한다. 클론은 사용자가 원하는 얼굴, 목소리 그리고 제스처 등을 쉽고 빠르게 커스터마이징해 버추얼 휴먼을 만드는 솔루션이다. 이를 통해 기업 단위에서 이용되던 버추얼 휴먼이 일반 대중에게까지 폭넓게 확대될 것으로 기대된다.
버추얼 휴먼이란 기술을 따라오는 윤리 문제가 바로 ‘딥페이크’다. '딥러닝(deep learning)'과 '페이크(fake)'의 합성어인 딥페이크(deepfake)는 인공지능으로 유명인의 얼굴을 영상에 합성하는 기술이다. 딥페이크 영상이 가짜뉴스나 음란물 제작 등에 활용되면서 사회적 문제로 떠올랐다. 버추얼 휴먼을 제작하는 기술이 사회적 문제를 야기함에 따라 기술의 필요성에 대해 대중들은 회의감을 느끼고 있다. 전문가들은 딥페이크 영상을 판별하는 기술이 발전하고 있어, 가짜 영상을 발견하면 삭제 조치를 취할 수 있다고 말한다. 다만, 대부분의 해결책은 영상이 제작되고 난 뒤 이뤄지는 사후 대응이라는 지적이 나온다.
강지수 CRO는 “SNS도 처음 나왔을 때 댓글 기능이 생기면서 많은 사회적 이슈가 생겼다. 여전히, 문제가 남아 있지만 법적인 고도화에 따라서 문제들이 해결되고 있는 상황이다. 버추얼 휴먼도 법적인 고도화가 진행됨에 따라, 다양한 이슈들이 해결될 수 있다고 본다. 또, 일반 대중의 인식도 바뀔 거라고 본다. 유튜브도 처음엔 다양한 영상이 올라왔고, 선정적인 콘텐츠도 많았다. 유튜브가 정착하면서 대중들도 더 좋은 콘텐츠를 원하게 됐고, 이에 따라 영상의 퀄리티도 많이 올라갔다. 버추얼 휴먼이 보급되는 과정에서 대중들도 더 좋은 이용 방식을 발견할 것이라고 본다”고 말했다.
글 / IT동아 정연호 (hoho@itdonga.com)