IBM, “왓슨x.데이터는 AI 비즈니스를 위한 맞춤형 저장소”

김영우 pengo@itdonga.com

[IT동아 김영우 기자] 인공지능(이하 AI)이 기업 업무에 직접적으로 영향을 미치는 시대가 되었다. 특히 챗GPT(ChatGPT)로 대표되는 생성형 AI의 경우, 간단한 대화만으로 논문을 쓰거나 코딩을 하는 등의 놀라운 결과물을 선보여 화제가 되기도 했다.

13일 한국IBM 본사에서 개최된 왓슨x.데이터 기자 간담회 현장
13일 한국IBM 본사에서 개최된 왓슨x.데이터 기자 간담회 현장

대표적인 기업 솔루션 기업 중 하나인 IBM 역시 AI 기반 비즈니스 생태계를 구축하는데 힘을 기울이고 있다. 지난 10일 IBM이 발표한 ‘왓슨x(Watsonx)’가 그 핵심이다. 왓슨x는 AI 모델 학습 및 검증, 조정, 구축하기 위한 ‘왓슨x.AI(watsonx.ai)’, 위치와 상관 없이 자유롭게 데이터 접근이 가능한 저장소인 ‘왓슨x.데이터(watsonx.data)’, 그리고 의사 결정의 안정성 및 신뢰성을 높이기 위한 ‘왓슨x.거버넌스(watsonx.governance)’로 구성되었다.

13일, 한국 IBM은 왓슨x의 주요 구성 요소 중 하나인 왓슨x.데이터를 소개하는 기자 간담회를 개최했다. 한국IBM CTO(최고기술경영자) 이지은 전무는 생성형 AI의 중요성이 커지고 있는 현재 시점에서, 이런 AI의 기반이 되는 데이터의 관리 및 활용 방법 역시 주목해야 한다고 강조했다. 특히 데이터가 어느 장소에 있더라도 쉽게 활용 가능하며, 생성된 AI 모델의 윤리성이나 신뢰성까지 보장할 수 있는 왓슨x에 주목해 달라고 밝혔다.

한국IBM CTO(최고기술경영자) 이지은 전무
한국IBM CTO(최고기술경영자) 이지은 전무

왓슨x.데이터는 AI 비즈니스에 최적화된 저장소의 일종이다. 왓슨x.데이터에서 관리되는 다양한 데이터를 활용해 AI 모델의 학습 및 튜닝이 가능하다. 데이터의 양이 급증하고 있고, 특히 관리하기 힘든 비정형 데이터가 다양한 위치에 저장되고 있는 현재 상황에서 왓슨x.데이터는 데이터 관리의 복잡성을 해소할 것이라고 IBM은 강조했다.

진화한 레이크하우스로서의 왓슨x.데이터가 갖춘 특징 (출처=IBM)
진화한 레이크하우스로서의 왓슨x.데이터가 갖춘 특징 (출처=IBM)

기존에는 이미 잘 가공된 정형 데이터를 모아둔 저장소인 데이터 웨어하우스(Data warehouse), 그리고 종류를 가리지 않고 다양한 비정형 데이터를 저장하는 데이터 레이크(Data lake)가 확실히 구분되어 있었다. 왓슨x.데이터는 데이터 웨어하우스와 데이터 레이크의 장점을 모두 결합한 ‘데이터 레이크하우스(Data Lakehouse)'를 지향하는 데이터 저장소이며, 초기 레이크하우스보다 진화한 제품임을 강조하고 있다.

정형 및 비정형 데이터의 활용 및 관리를 편하게 할 수 있으며, 용량 역시 무제한으로 확장 가능한 것이 왓슨x.데이터의 장점이다. 또한 클라우드뿐만 아니라 온프레미스(내부망), 혹은 여러가지가 혼합된 하이브리드 멀티 클라우드 환경에도 완벽하게 대응하는 것 역시 차별화 요소라고 IBM은 강조했다.

이와 더불어 모든 데이터에 대한 단일 포인트 접근이 가능하며, 내장된 거버넌스를 사용해 각종 규정 및 보안 문제를 해결할 수 있다. 분석 데이터 연결 후, 단순 클릭 몇 번으로 자신이 원하는 데이터를 조합해 목적에 맞는 엔진을 몇 분 만에 빠르게 배포할 수 있는 자동화 기능도 특징이다.

왓슨x.데이터 시연 모습. 자연어 기반 대화를 통해 손쉽게 데이터의 검색 및 분류가 이루어진다
왓슨x.데이터 시연 모습. 자연어 기반 대화를 통해 손쉽게 데이터의 검색 및 분류가 이루어진다

한편 이날 행사장에선 왓슨x.데이터의 실제 시연도 이루어졌다. 복잡한 명령어의 입력 없이, 화면 한 켠에 표시된 AI 챗봇과 자연스럽게 대화하며 원하는 데이터를 손쉽게 찾을 수 있었다. 이렇게 찾아낸 데이터는 단순히 파일명으로만 나열되는 것이 아니라 각 데이터의 정의에 따른 분류가 이루어지고 자세한 설명까지 자동 생성되어 높은 편의성을 기대할 수 있다.

왓슨x.데이터는 거대 AI/ML 모델 제작 및 실시간 분석, 비즈니스 인텔리전스에 최적화되었으며, 데이터 엔지니어링 간소화와 책임감 있는 데이터 공유에 큰 도움이 될 것이라고 IBM은 강조하고 있다. 왓슨x.데이터는 오는 7월 한국을 포함한 전 세계에 정식 출시될 예정이며 당초 영문판으로 선보이지만 내년 1분기 중 한글화도 될 예정이다.

이날 IBM은 왓슨x.데이터를 소개하며 IBM이 오랫동안 기업용 솔루션 시장에서 구축한 생태계를 강조하기도 했다. 왓슨x.데이터가 IBM 뿐만 아니라 서드파티의 제품과도 통합이 가능하다는 점, 그리고 클라우드 환경 외에도 온프레미스 환경에서도 높은 성능을 발휘한다는 점을 여러 번 언급했다.

한편, 기존의 왓슨이 높은 인지도에 비해 실제 시장에서 거둔 성과가 기대에 미치지 못했다는 지적에 대해 IBM은 “기존의 왓슨이 초기 단계의 AI였다면 왓슨x는 청년 수준으로 성장했다”며 “왓슨x의 ‘x’는 차세대(Next Generation)를 의미한다”고 강조했다.

글 / IT동아 김영우 기자(pengo@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.