인공지능 챗봇 '챗GPT'에게 '챗GPT'를 물었다, 그러자 '사람'처럼 대답했다

남시현 sh@itdonga.com

[IT동아 남시현 기자] 10일(현지 시각), 마이크로소프트가 챗GPT(Chat GPT) 개발사인 오픈 AI에 100억 달러(한화 약 12조 5천억 원)를 지원할 수 있다고 블룸버그통신이 보도했다. 블룸버그통신은 마이크로소프트가 수년에 걸쳐 오픈 AI에 대해 투자하는 계약에 대해 논의하고 있으며, 아직 투자가 확정된 건 아니라고 전했다. 마이크로소프트는 지난 2019년에도 퍼블릭 클라우드인 애저(Azure)의 인공지능 기능을 개발하기 위해 오픈 AI에 10억 달러를 투자한 바 있으며, 오는 3월에는 검색엔진인 ‘빙(Bing)’에 ‘GPT3’ 기반 챗봇을 적용할 예정이다.

출처=IT동아
출처=IT동아

수많은 인공지능들 사이에서도 챗GPT가 유독 대규모 투자를 유치하는 배경은 활용도 덕분이다. 지난해 IT업계의 화두였던 DALL-E나 노벨AI(NovelAI), 미드저니(Midjourney) 등의 인공지능은 이미지 기반의 인공지능이어서 용도가 제한적이었다. 반면 챗GPT는 단어가 아닌 문장을 통해 질문을 주고받는 대화형 인공지능으로, 적용 범위와 활용도가 훨씬 좋다. 상용화에 성공한다면 십수 년 간 이어져온 검색 엔진의 패러다임을 완전히 바꿔놓는다거나, 음성인식 비서의 성능이 월등해지는 등의 결과를 기대할 수 있다. 이번 기사에서는 챗GPT의 현재와 성능, 그리고 성공 가능성을 조명해 본다. 또한 기사 중 일부는 실제로 챗GPT가 대답한 문장을 그대로 기재한다.

오픈 AI의 챗 GPT, 챗봇 넘어선 인공지능 단계의 기술

챗GPT는 현재 오픈베타 기간으로, 누구나 계정만 생성하면 무료로 활용해 볼 수 있다. 챗GPT의 명령창에 챗GPT에 대해 쉽게 설명해 달라는 주문을 넣었다. 여기에 따른 대답은 “Chat GPT는 컴퓨터 프로그램입니다. 이 프로그램은 많은 사람들의 대화를 읽어들이고 그것들을 기억합니다. 그리고 프로그램은 사람들이 보내는 메시지를 이해하고 비슷한 대화를 생성할 수 있도록 학습합니다”라며 설명을 시작했다.

챗GPT에게 챗GPT에 대한 설명, 그리고 챗봇과의 차이점에 대해 질문한 다음 그 답변을 기사에 그대로 첨부한다. 출처=IT동아
챗GPT에게 챗GPT에 대한 설명, 그리고 챗봇과의 차이점에 대해 질문한 다음 그 답변을 기사에 그대로 첨부한다. 출처=IT동아

이어서 예시가 등장했다 “예를들어, 만약 사람이 "안녕, 날씨 어때?"라고 묻는다면, Chat GPT는 이전에 읽어들인 대화에서 날씨에 관한 것들을 기억해서 "오늘 날씨는 화창해요"라는 응답을 생성할 수 있습니다. 이것은 종이책과 펜과 같은 기본적인 책과 글씨들을 기억하는 것과 비슷합니다. 프로그램이 많은 책과 글씨들을 읽어들이면 그것들을 기억하고 이해할 수 있게 됩니다. 그리고 이를 통해 새로운 글씨를 쓸 수 있게 됩니다”라고 기재했다.

챗GPT가 일반 챗봇과 다른 이유에 대해 재차 묻자 “일반적인 챗봇은 특정한 질문에 대해 응답을 할 수 있도록 설계되어 있습니다. 이러한 챗봇은 사전에 정의된 응답을 가지고 있어 사용자의 질문에 대해 해당 응답을 할 수 있습니다”라면서, “하지만 Chat GPT는 인공 지능을 기반으로 하며, 인간의 언어를 처리할 수 있도록 학습되어 있습니다. 이러한 인공 지능 모델은 사용자의 질문에 대해 자연스러운 대답을 생성할 수 있습니다. 사용자의 질문에 대해 알맞은 대답을 생성하는 것이 가능하도록 학습되어 있기 때문에 사용자와 자연스러운 대화를 할 수 있습니다”라고 답했다.

애플 시리(좌)와 삼성 빅스비(우) 실행 화면. 출처=IT동아
애플 시리(좌)와 삼성 빅스비(우) 실행 화면. 출처=IT동아

애플 시리나 삼성 빅스비 등 기존의 인공지능 비서는 대화를 인식해도 서버에 지정된 스크립트로만 의사소통을 진행할 수 있고, 복잡한 질문이나 추론을 요구하는 것에 대해서는 대답하지 못한다. 반면 챗GPT는 자연어 입력을 이해하고, 특정 분야나 산업에 최적화된 결과를 제공하며, 또 기존 시스템에 대화 기능을 추가하는 것 만으로 적용할 수 있다. 즉 실시간으로 문장을 이해하고 맥락에 맞는 해답을 내놓음으로써 한 차원 더 높은 성능을 발휘하는 것이다.

왜 시장은 챗GPT에 열광하나?

IT 기업들이 챗GPT에 집중하는 이유는 현재 서비스의 시장 가능성을 확대하고, 또 시장을 선점하기 위한 목적이 크다. 오는 3월 중으로 검색 엔진 ‘빙(Bing)’에 GPT3 기술을 적용하는 마이크로소프트만 하더라도 구글이 장악하고 있는 검색 엔진 점유율을 탈환하고자 한다. 챗GPT에 마이크로소프트가 빙에 GPT3를 적용하는 이유에 대해 묻자 네 가지 대답이 돌아왔다.

챗GPT에게 간단한 악보를 만들어보라고 주문했다. 출처=IT동아
챗GPT에게 간단한 악보를 만들어보라고 주문했다. 출처=IT동아

챗GPT의 응답은▲ GPT-3는 자연어 입력을 이해하고 응답할 수 있는 언어 모델로, 텍스트 생성, 번역, 언어 이해 등 다양한 자연어 처리에 적합 ▲ 마이크로소프트는 고객에게 더 정확한 챗봇, 가상 비서, 스마트 이메일 답장 등을 구축할 수 있게 됨 ▲ 인간의 업무를 자동화할 수 있으며, 문서나 보고서, 요약 등의 효율성을 끌어올림 ▲ 마이크로소프트의 인공지능과 언어 처리 연구의 경쟁력을 끌어올림 으로 정확하면서도 일목 요연하게 분석 결과를 도출해 냈다.

챗GPT는 수준급의 코딩 능력을 갖춰 업계의 비상한 관심을 받고 있다. 출처=IT동아
챗GPT는 수준급의 코딩 능력을 갖춰 업계의 비상한 관심을 받고 있다. 출처=IT동아

단순 검색뿐만 아니라 소설, 시나리오, 보고서 작성, 작곡, 코딩 등 기존의 인공지능으로는 해결할 수 없었던 창의성이 필요한 영역까지 진행한다. 예를 들어 몇 가지 오류가 있는 C언어 기반의 마방진(Magic Square) 코드를 질문해 보니, 어떤 문제를 어떻게 수정해야 하고, 또 왜 코드가 동작하지 않는지에 대한 답을 내놨다. 한국 사회와 사람들의 이중성에 대한 영화 시나리오를 요청하자 ‘두 가지 삶’이라는 단막극 시나리오를 써냈다. 이처럼 챗GPT는 기존의 그 어떤 인공지능보다도 응용 가능성이 뛰어난데 다가, 사용법을 설명할 필요가 없을 정도로 쉽다.

챗GPT가 활약할 수 있는 분야는?

교육이나 언어 학습, 코딩, 계산, 챗봇 등의 분야에서는 이미 챗GPT를 기반으로 하는 사업화가 꾸준히 진행되고 있다. 챗GPT에 활용 분야를 물어보니 “텍스트 생성 분야에서는 자연어 생성, 요약, 번역, 자동 기재, 챗봇 등에 활용할 수 있으며 텍스트 분류 분야에서는 감정 분석, 이해, 태깅, 요약, 질의응답에 활용할 수 있다. 추론 분야에서는 자연어 이해, 텍스트 생성, 강화학습, 질의응답. 대화 생성, 생성적 코딩 등에 활용할 수 있다”고 한다.

마이크로소프트가 GPT3를 활용해 선보인 노코드 기반의 코딩 앱. 출처=마이크로소프트
마이크로소프트가 GPT3를 활용해 선보인 노코드 기반의 코딩 앱. 출처=마이크로소프트

오픈 AI에 대규모 투자를 추진하는 마이크로소프트는 지난해 클라우드 기반의 노코드 빌더 ‘파워 앱스’에 GPT3를 적용해 대화형식으로 코드를 개발하는 기능을 선보였고, 베스핀글로벌은 대화형 인공지능 플랫폼 ‘헬프나우AI’에 GPT 기술을 도입해 응답 성능을 높였다. 엔비디아와 그래프코어 등 인공지능 전문 반도체 기업들도 GPT에 대응하는 전용 반도체 시스템이나 플랫폼 등을 선보인 상황이다. 오픈 AI CEO 샘 알트만이 GPT3 출시 이후 3년 뒤인 2023년이면 GPT4를 선보일 수 있을 것이라고 발언한 적이 있는데, 예정대로 출시만 된다면 시장 상황은 더욱 급변할 것으로 보인다.

앞으로의 챗GPT는 어떻게 될 것인가

샘 알트만은 GPT4가 튜링 테스트를 통과했다는 축하 메시지에 긍정적인 반응을 내놓은 바 있다. 출처=샘 알트만 트위터
샘 알트만은 GPT4가 튜링 테스트를 통과했다는 축하 메시지에 긍정적인 반응을 내놓은 바 있다. 출처=샘 알트만 트위터

인간과 구분하기 힘들 정도의 대화 능력을 제공한다는 점은 인상적이다. 차기 버전인 GPT4의 경우 기계가 얼마나 인간과 비슷하게 대화할 수 있는지를 판별하는 ‘튜링 테스트’를 통과한 상황이다. 튜링 테스트 자체가 현대 인공지능을 평가하기에 변별력 있는 방법은 아니기 때문에 샘 알트만 역시 튜링 테스트 통과에 큰 의미를 두지 않는다고 말했지만, 아직 튜링 테스트조차 통과하지 못하는 다른 인공지능들과 비교하면 월등히 앞선 결과인 셈이다.

독도에 대해 물어본 대답은 분쟁 가능성이 있다고 대답했으나, 일본어로 물어본 대답은 완전히 틀린 내용을 대답했다. 출처=IT동아
독도에 대해 물어본 대답은 분쟁 가능성이 있다고 대답했으나, 일본어로 물어본 대답은 완전히 틀린 내용을 대답했다. 출처=IT동아

하지만 챗GPT가 만능은 아니다. 초기 버전인 GPT1의 데이터 풀인 ‘매개변수’는 1억1700만 개, GPT2는 15억 개, 현재 버전인 GPT 3는 1천750억 개의 매개변수를 갖고 있다. 앞으로 매개변수의 숫자가 늘면서 성능도 꾸준히 향상되겠으나, 여전히 능동적인 동작이 아닌 데이터에 의존하는 약인공지능의 한계를 넘을 순 없다. 동작 측면에서도 정치적 변수나 윤리적 문제에 대해서는 여전히 갈 길이 멀고, 틀린 내용도 사실인양 얘기하는 특성이 있다. 전문적인 내용을 검색 기반으로 세세하게 설명하려고는 하나, 역시 틀린 내용이 섞여있기도 하다. 텍스트라는 한계를 벗어나기 힘든 점도 넘어야 할 산이다.

그럼에도 불구하고 챗GPT는 그간 등장한 인공지능 중에서도 가장 진보된 결과와 성능을 보여주며, 앞으로 인공지능이 추구해야 할 목표도 뚜렷하게 제시하고 있다. 하나의 이정표로 성장한 챗GPT가 올해는 또 어떤 기술적 충격을 안겨줄지 두려움과 기대가 동시에 앞선다.

글 / IT동아 남시현 (sh@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.