내 PC에 인공지능이? 엔비디아 ‘Chat With RTX’ 써보니

강형석 redbk@itdonga.com

[IT동아 강형석 기자] 지난 14일, 엔비디아는 윈도우 PC 시스템 내에서 사용 가능한 챗봇, 챗 위드 알티엑스(Chat With RTX)를 공개했다. 이 소프트웨어는 개인 맞춤형 인공지능(AI) 챗봇이라 강조한다. 시스템 내 문서와 메모, 동영상, 그 외 데이터를 인공지능이 인지하고 차후 검색했을 때 즉시 결과를 내놓는 형태다.

엔비디아는 대규모 언어 모델 기반 생성적 사전학습 변환기(GPT LLM)를 개인화할 수 있는 앱이라고 말한다. 상용화된 것은 아니고 일부 기능을 쓸 수 있는 체험판이다. 검색 증강 생성(RAG)과 엔비디아 그래픽 프로세서가 지원하는 명령어(RTX, TensorRT-LLM) 등을 십분 활용한다. 따라서 앱을 쓰려면 8GB 이상 메모리를 갖춘 지포스 RTX 30 시리즈 이상 그래픽카드가 필요하다.

엔비디아 홈페이지에서 Chat With RTX를 내려받을 수 있다. / 출처=IT동아
엔비디아 홈페이지에서 Chat With RTX를 내려받을 수 있다. / 출처=IT동아

Chat With RTX는 엔비디아 홈페이지에서 내려받을 수 있다. 해당 이름으로 검색을 하거나 첫 페이지에 별도로 링크가 마련되어 있으니 접속하면 된다. 파일은 약 35GB 정도로 큰 편이니 설치 전, 저장공간을 충분히 확보하자.

설치는 크게 2가지로 이뤄져 있으며 하나는 Chat With RTX와 미스트랄 7B INT4 세트 설치 항목으로 이뤄져 있다. Llama2 세트도 설치파일 내에는 포함되어 있지만 설치 과정 중 선택지는 등장하지 않았다. 설치가 끝나면 바탕화면의 아이콘을 실행하면 된다. 일부 오류를 내는 시스템도 있는 것으로 알려져 있는데 엔비디아 포럼에 해결 방안이 다양하게 있으므로 확인해 보자.

실행하면 명령프롬프트 가동이 먼저 시작되며 관련 파일을 불러온다. / 출처=IT동아
실행하면 명령프롬프트 가동이 먼저 시작되며 관련 파일을 불러온다. / 출처=IT동아

실행하면 명령프롬프트가 먼저 실행되며 몇몇 파일을 불러온 후 별도의 브라우저를 출력하게 된다. 여러 브라우저가 설치된 시스템이라면 무엇을 우선시할지 확인하는 과정을 거친다.

Chat With RTX는 브라우저 상에서 실행된다. 인터페이스 구성은 매우 간단하다. / 출처=IT동아
Chat With RTX는 브라우저 상에서 실행된다. 인터페이스 구성은 매우 간단하다. / 출처=IT동아

브라우저가 실행되면 Chat With RTX의 주요 화면이 출력된다. 구조는 매우 간단하다. 먼저 좌측 상단에는 인공지능 모델을 선택할 수 있다. 기본으로 미스트랄 7B INT4 세트가 설정되어 있다. 기자가 사용하는 시스템에서는 Llama2를 선택할 수 없었다. 확인해 보니 해당 명령어를 쓰려면 15GB 이상 비디오 메모리를 가진 그래픽카드를 조건으로 내걸었다. 그러니까 12GB 메모리를 품은 기자의 지포스 RTX 3080 12GB로는 사양을 충족시키지 못했던 것이다.

우측 상단은 데이터 세트를 설정해 원하는 결과를 얻도록 선택 가능하다. 폴더를 지정해서 구현할지 유튜브 링크를 기반으로 할지 인공지능 모델 기본으로 설정할지 등 3가지 항목 내에서 고르면 된다.

참조파일 기반 아래에서 활용할 경우 인공지능이 인지할 수 있는 폴더를 선택해야 된다. 검색은 문서파일 위주로 가능하며 TXT, PDF, DOC 파일을 지원한다. 폴더를 지정하면 Chat With RTX 프롬프트 내에서 폴더 데이터를 불러들이는 작업을 거치는데 용량과 구성에 따라 소요시간이 천차만별이니 참고하자. 만약 대용량 하드디스크 내 자료를 통째로 불러올 경우 상당한 시간이 필요하므로 가급적 용량이 적은 단일 폴더로 구성하는 게 좋다.

보완할 부분은 많지만, 챗봇의 느낌을 잘 구현한 것이 특징이다. / 출처=IT동아
보완할 부분은 많지만, 챗봇의 느낌을 잘 구현한 것이 특징이다. / 출처=IT동아

문서 파일 내 내용을 찾거나 간단한 질문에 대한 답변은 비교적 빠른 시간 내에 알려준다는 것이 Chat With RTX의 특징이다. 무엇보다 흔히 쓰는 인공지능 서비스는 온라인 연결이 필수인데 반해 이 앱은 온라인 연결이 필요 없다. 고급 기능까지 바라는 건 무리지만, 내 시스템에 숨어 있는 문서를 빠르게 검색하고 필요한 결과를 얻는다는 부분은 인상적이었다. 속도도 매우 빠른데 앞서 언급한 것처럼 하드디스크에 폴더 동기화를 했을 경우, 용량에 따라 대응이 느릴 수 있다.

유튜브 대화기능도 마찬가지다. 자주 쓰는 링크를 인식해 두면 시스템 내에 있는 파일 내에 스크립트가 저장되고 검색하면 빠르게 관련 내용을 출력해 준다. 기본 인공지능 모델을 사용하면 사전에 학습된 내용에 기반해 구동된다. 아직 체험판 수준이기 때문에 완벽한 기능을 기대하면 실망할 수 있다. 파일을 검색하고 간단한 궁금증 정도는 해결하는데 도움이 되지만, 복잡한 사항에 대해서는 향후 보완이 필요하다.

RTX 20 시리즈도 인공지능 처리가 가능하지만, Chat With RTX에서는 지원하지 않는 점이 아쉽다. / 출처=IT동아
RTX 20 시리즈도 인공지능 처리가 가능하지만, Chat With RTX에서는 지원하지 않는 점이 아쉽다. / 출처=IT동아

또한 왜 지원 시스템을 지포스 RTX 30 시리즈 이상으로 설정했는지도 의문이다. 이전 세대인 지포스 RTX 20 시리즈에도 제품에 따라 8GB 이상 메모리, 그래픽 프로세서 내에 인공지능 처리 기능을 품었다. 업데이트될 Chat With RTX에서 지원할지 알 수 없지만, 계속 지원하지 않는다면 1세대 RTX 그래픽카드의 존재 의의가 궁금해진다.

PC 내에서 쓰는 이른바 로컬 챗봇인 Chat With RTX. 네트워크 연결 없이 시스템 내 자원을 검색하고 내용까지 일부 파악할 수 있다는 점에서 잠재력이 느껴진다. 엔비디아에서 앱을 지속적으로 업데이트해준다면 윈도우 운영체제의 부족한 검색기능을 충분히 보완해 줄 것으로 기대된다.

글 / IT동아 강형석 (redbk@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.