[모두를 위한 인공지능] 7. 아이언맨의 '자비스' 같은 인공지능, 과연 가능할까?

이문규 munch@itdonga.com

[IT동아]

[편집자주 / '인공지능(AI)'은 더 이상 SF영화에서나 보던 상상의 기술이 아닙니다. 이미 현실과 실제가 되어, 알게 모르게 우리 일상에 스며들고 있습니다. 이에 인공지능에 관한 보편적 지식은 현대인이라면 누구라도 가볍게 알아 둘 만합니다. 이 연재에서는 인공지능의 역사부터 일상/산업 내 융합, 국내외 인공지능 산업 현황, 인공지능 관련 최신 트렌드, 근미래의 인공지능 융합기술 등, 필자가 오랜 동안 현업에서 얻은 다양한 경험과 지식을 하나씩 독자와 공유합니다.]

1부 - 환갑이 훌쩍 넘은 인공지능의 어제와 오늘 (https://it.donga.com/102301/)

2부 - 인공지능 기술을 활용해 비즈니스 가치를 높여라 (https://it.donga.com/102418/)

3부 - 인공지능 산업/기업을 지원, 육성하기 위해 필요한 것 (https://it.donga.com/102543/)

4부 - 인공지능이 아무리 발전해도 결국 사람의 '경험'이 중요하다 (https://it.donga.com/102629/)

5부 - 우리에게 '데이터'는 어떤 의미인가 (https://it.donga.com/102667/)

6부 - 인공지능이 만든 딥페이크의 명과 함 (https://it.donga.com/102750/)

지난 연재에서 인공지능의 딥러닝 기술을 활용하는 '딥페이크(Deepfake)'에 대해 소개하고, 인간이 구분하지 못하는 창작물을 만들어 내는 인공지능에 관해 다뤘다. 인공지능은 이렇듯 인간이 구분해 내지 못할 수준의 창작물을 만드는 단계에 이르렀다. 우리 일상에서는 아파트 출입이나 CCTV 활용 범위를 비롯해, 모두가 사용하는 스마트폰이나 자동차 등에도 인공지능 기술이 적용돼 있지만, 대부분의 사람들은 아직 인공지능에 관해서는 개념과 정의 정도만 알고 있다. 왜 그럴까?

우리나라의 인공지능 이해 정도 (출처=입소스 결과)
우리나라의 인공지능 이해 정도 (출처=입소스 결과)

아마도 인공지능을 사용하기가 아직은 복잡하고, 자신과는 별 상관 없다는 생각 때문은 아닐지 필자는 추측해본다. 인공지능을 활용하기 위해 글로벌 기업을 중심으로 다양한 프레임워크와 언어가 개발, 보급되고 있다. 다만 인공지능을 활용하기 위해서는 지난 연재에서도 언급했듯, 문제를 정의하고 인공지능 모델을 만들어 학습케한 다음, 추론모델을 기반으로 각 도메인마다 비즈니스에 적용하는 일은 데이터 전문가부터 인공지능 모델 설계자, 비즈니스 개발과 시스템 전문가 등 다양한 분야의 전문가들이 한데 모여 구상해야 한다. 특히 개인이나 소규모 조직의 경우 인공지능 개발팀을 꾸린다 한들, 처음부터 원하는 대로 추진하기에는 상당한 비용과 노력이 필요하다.

인공지능 활용을 위한 다양한 프레임워크와 언어가 제공되고 있다 (출처=곽재도)
인공지능 활용을 위한 다양한 프레임워크와 언어가 제공되고 있다 (출처=곽재도)

우리는 영화 '아이언맨(Iron Man)'에 나오는 인공지능 '자비스(J.A.R.V.IS)'처럼, 사람이 말만 하면 알아서 답을 척척 찾아 주거나, 스스로 자료/데이터 학습을 통해 발전하는 수준의 인공지능이 나오길 기대한다. 그러면 복잡한 개발 및 활용 단계를 거치지 않고도, 개인이 원하는 대로 쉽고 간편하게 인공지능을 활용할 수 있을 것이다.

영화 '아이언맨'의 인공지능 '자비스' (출처=구글 이미지 챕처)
영화 '아이언맨'의 인공지능 '자비스' (출처=구글 이미지 챕처)

필자는 머지 않아 이 같은 일이 가능해지리라 생각한다. 서론이 좀 길었는데, 이번 연재에서는 인공지능의 발전과 더불어 어떤 문제가 발생할 수 있을지 이야기해보려 한다.

인공지능에 관심이 있다면 작년부터 거론된 '초거대 인공지능(Super- Giant AI, 이하 초거대 AI)'라는 용어에 익숙할 것이다. 여러 언론을 통해서도, 국내외 주요 대기업이 수천억 개의 파라메터를 가진 초거대 AI 모델을 학습하는데 성공했다는 기사가 보도됐다. AI 모델이 커지면 어떤 점이 좋아질까? 모델 크기가 커지면, 모델의 품질과 정교성이 말할 수 없을 정도로 높아진다.

예를 들면 인간의 언어를 초거대 AI 모델로 학습시킨 인공지능은 사람의 말을 마치 '사람'처럼 아주 잘 알아 듣는다. 실제로 마이크로소프트가 주도하는 OpenAI의 자연어 모델 기반의 초거대 AI는 문맥을 파악하여 사람처럼 대화하거나, 심지어 창의적인 대답을 내기도 한다.

작년말 발표된 OpenAI의 초거대 AI 모델인 GTP3 (출처=OpenAI 홈페이지)
작년말 발표된 OpenAI의 초거대 AI 모델인 GTP3 (출처=OpenAI 홈페이지)

이런 기능과 요소를 활용한다면, 인간이 지금까지 기록한 모든 데이터(논문, 특허, 각종 자료 등)를 기반으로, 새로운 창작물과 인간에게 필요한 콘텐츠를 직접 만들어 낼 수 있지 않을까? 실제로 그리 진행되고 있다. 국내외 대기업들이 초거대 모델을 학습시킨 인공지능을 만들고, 이를 기반으로 새로운 분야에 다양한 크기로 적용하는 하이퍼스케일(Hyperscale) 인공지능을 개발, 적용하기 시작한 것이다.

초기 언어모델로 시작한 게 현재는 이미지를 분석, 이해하는 단계로 발전하고 있다. 실제로 LG AI 연구원은 3천 억 개의 파라메터를 지닌 초거대 인공지능 모델을 기반으로 언어 및 이미지를 이해, 분석하는 모델을 만들었다. 네이버는 인간의 언어를 이해해 그림을 그리는 솔루션으로 제작한 창작물을 지난 4월 북미 최대 테크 컨퍼넌스인 '콜리전(Collision)'에 선보이기도 했다.

인간의 언어인 글과 말은 커뮤니케이션에 있어 근본이 되는 도구라, 인공지능이 이를 이해, 분석해 정교화하고 품질을 높이려는 도전은 충분히 납득할 만하다. 그럼 왜 글과 말 다음이 이미지/사진일까? 개인적으로, 인간의 오감 중 시각적 요소가 인지/판단의 70~80%를 좌우한다는 연구결과가 있듯, 인간에게 표출하는 요소나 창작적 요소 중 가장 중요한 시각적 요소를 먼저 만드는 게 아닐까 생각한다.

이후 초거대 인공지능은 과연 인간의 창작 영역까지 들어올 수 있을까? 영상 소셜미디어인 틱톡은 사용자가 특정 문구를 입력하면 인공지능이 자동으로 이미지를 편집해 주는 ‘인공지능 스크린’ 기능을 적용했다. 특정 이미지를 설명하는 단어를 입력하면 다른 사용자가 올린 이미지와 설명을 토대로 이미지를 분석하여 이미지를 변환하는 기술이다. 다만 언어를 이미지로 '전환'하는 기술이 아닌 아직은 '변환'이 적합한 표현이다. 즉 아직까지는 창작이 아닌 변환 단계다.

앞에서 언급한 대로, 초거대 인공지능 모델을 토대로 하여 인간 언어의 문맥을 정교하게 이해하기 시작하면서, 이미지의 설명을 기반으로 그 특징을 서로 변환하는 단계에 이른 것이다. 예를 들면, '중세에 갑옷을 입은 기사'라는 문구에서 중세에 갑옷을 입은 기사 만을 검색하는 게 아니라, '갑옷', '중세', '기사'라는 단어를 중심으로 얼굴 표정과 배경 분위기 등을 만들어 내는 것이다.

인간의 언어 기반의 인공지능 변환 기술 (출처=조선일보 보도 캡처)
인간의 언어 기반의 인공지능 변환 기술 (출처=조선일보 보도 캡처)

이처럼 인공지능의 언어모델을 기반으로, 언어를 이미지로 또는 이미지를 언어로 변환하는 기술이 발전하면서, 이제는 인간 언어로 창작물을 만들어 제안하는 단계에 이른 인공지능 서비스도 여럿 등장했다. 네이버 경우 아이디어나 스토리가 있다면 누구나 이미지 기반의 콘텐츠를 만들 수 있는 인공지능 자동 드로잉 기능을 개발하고 있다. 구글도 인공지능이 그림 설명을 이해하고 어떤 생각을 갖는 지에 따라 그림을 추천하는 서비스인 '오토드로우'를 선보였다.

구글의 인공지능 그림 그리기 도구인 '오토드로우' (출처=오토드로우 홈페이지)
구글의 인공지능 그림 그리기 도구인 '오토드로우' (출처=오토드로우 홈페이지)

필자가 속해 있는 인공지능산업융합사업단은 인공지능 창업 및 기업 지원 캠프를 통해 70여 개 기업을 집적해 지원하고 있다. 이들 기업 역시 이미 인공지능을 통해 창작 또는 추천하는 기능을 구현해 서비스하고 있다. '나눔공간'은 자영업을 비롯한 많은 창업자들의 자신만의 브랜드나 로고를 만들 때, 인공지능을 활용해 각 기업이 원하는 브랜드나 로고를 창작할 수 있는 '알로비(AloB)'라는 서비스를 공개했다.

말로 설명하면 로고/브랜드 디자인을 해주는 인공지능 디자인 비서 서비스 '알로비' (출처=나눔공간)
말로 설명하면 로고/브랜드 디자인을 해주는 인공지능 디자인 비서 서비스 '알로비' (출처=나눔공간)

알로비는 고객이 갖고 있는 영감과 주관적인 느낌을 바탕으로, 객관적이면서 개성 있는 로고를 창작, 제안한다. 각종 로고나 브랜드의 저작권이나 중복 사용 등에 대해서도 인공지능이 미리 분석해 준다. 나눔공간은 이 서비스를 위해 인공지능 기반의 '루엔타 인공지능 엔진(Luenah AI Engine)'을 독자 개발했다. 단순히 디자이너를 도와주는 단계를 넘어 결과의 품질을 향상시키는 단계까지 인공지능이 처리한다. 실제로, 광주 AI 창업캠프의 로고 역시 인공지능을 활용한 디자인이다.

인공지능이 디자인한 광주 AI 창업캠프의 실제 로고 (출처=곽재도)
인공지능이 디자인한 광주 AI 창업캠프의 실제 로고 (출처=곽재도)

또한, 인공지능이 현재 사용자의 상황을 인지하여 개인의 감성을 알려주거나, 감성에 맞는 음악을 알아서 스트리밍하는 '인디제이'라는 기업도 있다. 인디제이는 이름처럼 인공지능이 사용자를 대상으로 디제잉한다. 사용자 스타일에 따른 음악을 추천할뿐 아니라, 현재의 감성을 대화나 상황을 통해 이해하는 자신만의 디제이 역할도 수행한다.

사용자의 감성을 대화나 상황으로 분석해 디제잉하는 '인디제이' (출처=인디제이 홈페이지)
사용자의 감성을 대화나 상황으로 분석해 디제잉하는 '인디제이' (출처=인디제이 홈페이지)

한편, 구글은 일반 사진을 유명 화가의 화풍으로 자동 변환하는 인공지능 솔루션인 '아트 트랜스퍼(Art Transfer)'를 선보인 바 있다. 사진을 입력하면 빈센트 반 고흐, 레오나르도 다빈치, 프리타 칼로 같은 세계적인 유명 화가의 고유 화풍으로 변환해 준다. 이는 단순히 각 화가 화풍의 특징을 인공지능이 학습하여, 그 특징에 따라 사진을 화가 화풍으로 재해석해 주는 기능이다.

풍경사진을 뭉크의 화풍으로 변환한 이미지 (출처= 구글 아트 트랜스퍼)
풍경사진을 뭉크의 화풍으로 변환한 이미지 (출처= 구글 아트 트랜스퍼)

이런 변환이 가능한 것은 인공지능 알고리즘 중 하나인 GAN(Generative Adversarial Network)과 전이학습(Transfer Learning)의 진화 덕분이다. 특히 GAN은 두 개의 딥러닝이 함께 실행되는 구조라서, 서로 가짜를 만들고 진위를 구분하는 경쟁을 만들어낸다. 당연히 기존 모델보다 학습에 더 많은 컴퓨팅 자원이 필요하나, 적은 데이터를 기반으로 학습하거나 새로운 창작을 만들어 내기에는 아주 좋은 구조를 가지고 있다. 구체적인 알고리즘과 그 결과에 대해서는 다음 연재에서 다룬다.

이렇게 GAN이라는 기술을 통해 창작품을 만들거나 변환하면, 인간의 눈으로 식별이 아주 어려워 진다. 지난 연재에서 소개한 '딥페이트(Deep Fake)' 기술도 대부분 이러한 GAN이라는 알고리즘을 사용한다. 예전에 언론을 떠들썩하게 했던 '천경자 미인도 위작 사건'을 기억할지 모르겠다. 천경자 화백은 자신이 그린 그림이 아니라고 하는데, 작품을 소장한 국립현대미술간과 감정가들은 진품이라고 반론하는 상황이었다. 논란에는 천경자 화백이 직접 그린 '장미와 연인'과 그 화풍과 스타일이 같고, 재료 또한 동일해 진품이라는 주장이었다.

'미인도' 작품(왼쪽)과 '장미와 연인(1981)' 작품(오른쪽) (출처=위키피디아 캡처)
'미인도' 작품(왼쪽)과 '장미와 연인(1981)' 작품(오른쪽) (출처=위키피디아 캡처)

천경자 화백은 여기에 분개하여, "내 작품은 내 혼이 담겨 있는 핏줄이나 다름 없습니다. 자기 자식인지 아닌지 모르는 부모가 어디 있습니까. 나는 결코 그 그림을 그린 적이 없습니다"라고 강력하게 부인했다. 만약 인공지능이 이러한 그림을 그린다면 어떨까? 앞서 설명한 것처럼, 인공지능이 그린 그림은 화풍이나 내용 등에 대해 인간이 식별하기 어려운 기술까지 이미 발전했다.

기술 발전과 함께 인공지능 윤리의 공론화 필요

인공지능의 도움으로 창작했는데, 이를 구별하는 방법을 알 수 없거나 다시 인공지능의 도움으로 진위를 식별해야 하는 시대가 이미 도래했다. 필자가 속해 있는 인공지능산업융합사업단의 지원을 받고 있는 '거인의 어깨'라는 기업은 사람 필체를 분석해 그 사람과 같은 글씨의 폰트(글꼴)를 만들어 준다.

영유아 시절 필체부터 성인까지 성장에 따라 변하는 필체를 인공지능이 모두 분석하여, 현재에는 알 수 없는 어렸을 적 필체까지 폰트로 구성해준다. 저렴한 비용으로 누구나 자신의 필체를 폰트로 쉽게 만들어 사용할 수 있는 정말 좋은 서비스다. 이런 서비스가 발전하면 인공지능이 자신의 사인/서명도 창작해서 만들 수 있지 않을까? 그리고 그 사인을 사람이 구별할 수 없게 된다면 어떻게 될까? 물론 이를 위한 다양한 보안 장치들도 마련될 것이지만.

인공지능이 만든 창작물은 이야기가 다르다. 인공지능이 만들었다고 표시만 하면 될까? 앞의 로고 디자인 사례처럼, 인공지능이 만든 창작물을 내가 수정하고 나의 결과물을 추가한다면 더욱 복잡한 상황이 된다. 인공지능 윤리 측면에서는, 이러한 가짜를 만들어 사람을 속이는 상황 외에 학습의 편향도 간과할 수 없다.

미국 내 여러 법원에서 현재 사용 중인 인공지능 재판지원 시스템인 '컴파스(COMPAS)'는 피고인의 데이터를 종합하여 재범 가능성을 예측하는 인공지능이다. 이에 따르면, 흑인의 재범 가능성이 백인보다 2배 이상 높은 것으로 나타났다. 하지만 현실에서는 흑인의 재범률은 백인보다 실제로 높지 않다.

미국 글로벌 기업 아마존은 2018년 인공지능 채용 프로그램을 도입했다. 채용과정에서 남성 지원자가 여성 지원자보다 우대를 받는 결과를 초래했고, 결국 그 프로그램은 폐기됐다. 원인은 무엇일까? 이처럼 인공지능이 점차 발전할수록 사람의 경험적 요소가 가장 중요해진다. 아마존의 경우는 개발직군 전체 직원수의 70% 이상이 남성임에 따라, 이를 학습한 인공지능도 현재를 예측하는 데는 편향성이 생길 수 밖에 없었다는 조사 결과가 있었다. 이렇듯 '인공지능 기술을 어떻게 잘 활용하고 현재의 사업에 접목하는가' 하는 문제 인식과 그 해결 방안은 최종적으로 우리들, 사람에게 있다는 인식의 확산이 필요한 시기다.

글 / 인공지능산업융합사업단 곽재도 본부장

미국 뉴욕 소재 로체스터 대학에서 인공지능 분야를 공부한 뒤, 문화체육관광부 문화기술 PD로 재직하며 연구개발 사업을 기획했다. 현재 대통령 소속 지식재산위원회 4,5,6기 전문위원으로 활동 중이며, 인공지능산업융합사업단 소속으로 국가 인공지능 데이터센터를 비롯해 인공지능 산업융합 생태계 조성을 위한 집적단지 조성사업을 추진하고 있다.

정리 / IT동아 이문규 (munch@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.