[스마트폰 활용하기] 카메라와 인공지능을 활용한 검색 도우미, 구글 렌즈와 빅스비 비전

남시현 sh@itdonga.com

[IT동아 남시현 기자] 우리와 가장 가까이 있는 인공지능은 애플 시리와 구글 어시스턴트, LG Q보이스, 삼성 빅스비 등이 있다. 카카오미니나 KT 기가지니, SKT 누구(NUGU) 같은 인공지능 스피커 역시 형태만 다를 뿐, 동작하는 형태는 대체로 비슷하다. 이런 형태의 인공지능 기기는 사용자가 기기를 활성화하면, 기기가 듣고 답을 준다. 예를 들어 애플 스마트폰 및 컴퓨터에 탑재된 인공지능 시리에게 '시리야, 십 분 후에 알람 울려줘' 라고 하면, 시리가 이 대화를 이해하고 십분 뒤에 알람을 설정한다.

하지만 음성으로 명령을 입력해야 해 복잡한 명령을 내리기가 어렵다. 또한, 특정 위치나 사물에 대한 정보를 찾는 것은 불가능하다. 이럴 경우 음성이 아닌 시각적 정보로 명령을 내리는 인공지능을 활용하면 쉽게 해결할 수 있다. 대표적으로 활용되는 것이 구글의 구글 렌즈, 삼성 스마트폰이라면 삼성 빅스비 비전을 이용해보자.

방대한 정보량과 필요한 정보에 집중하는 구글 렌즈

구글은 세계 최대 규모의 검색 엔진을 운영하고 있다. 당연히 정보 검색이나 데이터 보유량은 압도적이며, 인공지능과 호환성에 대해서도 지원을 아끼지 않는다. 구글 렌즈는 사진을 촬영하고, 촬영된 사진을 통해 얻을 수 있는 데이터를 기반으로 분석해 구글 엔진의 검색 결과를 보여준다.

안드로이드 스마트폰이고, 구글 어시스턴트가 이미 탑재돼있다면 어시스턴트 활성 상태에서 구글 렌즈로 바로 진입할 수 있다. 구글 어시스턴트가 없는 기종이라면 구글 플레이스토어에 진입해 '렌즈' 키워드를 검색 후 Google 렌즈를 다운로드하면 된다. 참고로 구글 렌즈는 애플 앱스토어에도 등재돼있어 아이폰 유저도 활용할 수 있다

구글 렌즈는 안드로이드 스마트폰, 그리고 애플 아이폰까지 사용할 수
있다.
구글 렌즈는 안드로이드 스마트폰, 그리고 애플 아이폰까지 사용할 수 있다.

기본 기능은 번역, 텍스트, 자동, 쇼핑, 음식점 등이며, 실시간으로 촬영하는 것을 포함해 이미 촬영된 사진을 분석하는 기능도 포함돼있다. 기능이 5개 밖에 없는 듯 보이지만 명함을 촬영하는 것만으로 연락처로 저장하는 기능, 책을 읽지 않고 표지를 검색하는 것만으로 검색하기, 전단지나 일정 게시물, 외국어를 촬영해 정보 검색하기, 모르는 그림을 촬영해 그림 제목과 화가 이름까지 알아내기, 식물 또는 동물을 촬영해 정보를 알아내는 식으로 응용할 수 있다.

구글 렌즈의 기능은 간결하며, 자동 모드의 응용 범위기
넓다.
구글 렌즈의 기능은 간결하며, 자동 모드의 응용 범위기 넓다.

구글은 유사 이미지 검색 능력이 뛰어난 기업이기 때문에 검색 정확도가 매우 높다. 제품을 쉽게 구분할 수 있는 특정 사항만 있다면 굉장히 높은 성공률을 자랑한다. 번역 역시 손으로 쓴 것이 아닌 기계로 인쇄된 폰트만 인식하지만, 구글 번역 자체의 완성도가 높기 때문에 번역의 정확성도 높다.

한 가지 단점이 있다면, 관련 검색 결과가 한국 웹사이트가 아닌 영어권 사이트로 연결될 수 있다는 점, 그리고 응용할 수 있는 범위가 추상적이기 때문에 순전히 자동 기능에 의존해 사용해야 한다는 점이다.

한국인에게 딱 맞는 활용도와 기능을 내세우는 삼성 빅스비 비전

삼성 빅스비비전은 삼성 스마트폰에서만 가능하다.
삼성 빅스비비전은 삼성 스마트폰에서만 가능하다.

삼성 빅스비비전은 삼성 스마트폰에만 포함된 기능이다. 삼성의 인공지능 비서인 빅스비가 포함된 기종이고, 최신 업데이트된 상태라면 기본 카메라 앱 실행 후 우측 상단의 '빅스비 비전'을 켜서 활성화할 수 있다. 삼성 공식 홈페이지 기준, 2018년 이후 출시된 제품 대다수가 빅스비 비전을 활용할 수 있으며, 삼성 스마트폰에서만 지원한다. 지원 언어는 영어와 한국어, 프랑스어, 독일어, 이탈리아어, 중국어, 스페인어가 포함돼있다.

빅스비 비전의 장점은 구글 렌즈와 다르게 각 기능이 잘 세분돼있다는 점이다. 구글보다 데이터베이스가 부족해, 각 메뉴를 나눠 인식률을 높인 것이다. 제공되는 메뉴는 쇼핑, 이미지, 장소, 텍스트, 음식, 와인, 메이크업, 책, QR코드가 있고, 부가기능을 추가할 수 있다.

기능이 잘 나뉘어있으며, 증강 현실을 기반으로
한다.
기능이 잘 나뉘어있으며, 증강 현실을 기반으로 한다.

구글 렌즈가 검색 기반이라면, 빅스비 비전은 증강 현실을 중점적으로 둔다. 메이크업 기능을 활용하면 볼터치, 아이섀도, 속눈썹 등을 실시간으로 합성해서 보여주고, 번역 기능도 구글 번역 기반으로 실시간 화면으로 보여준다. 쇼핑 기능은 국내 쇼핑몰인 11번가로 자동 연결되며, 와인 역시 와인품평앱 VIVNO로 자동 연결된다. 증강 현실을 기반으로 해 구글 렌즈보다 재밌고 다양한 기능이 많지만, 검색 기능의 데이터가 한정적이고 인식률이 상대적으로 떨어진다는 단점이 있다.

음성인식 인공지능이 대체하지 못하는 시각적 정보까지 분석하다

음성인식 인공지능에 특정 그림을 대화로 설명해서 알아내는 것은 불가능하다. 이미지 기반 인공지능이 등장한 이유도, 음성인식 인공지능의 사각지대를 보완하기 위해서다. 특히 그림 같은 경우, 순수 창작이 아니고 유명 작가가 그린 그림이라면 대단히 높은 성공률을 보인다. 피사체 자체의 개성이 뚜렷한 경우라면 쇼핑 검색도 어렵지 않다. 평소 궁금한 점이 많지만, 어떻게 찾아야 할지 고민되었다면 지금 바로 구글 렌즈를 설치해 자동 검색을 실행해보자.

글 / IT동아 남시현 (sh@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.