[한국 AI 1번지] (2) AI 왓슨의 실패, 우리나라는 걱정 덜 수 있는 이유는
[IT동아 차주경 기자] 2005년 IBM이 공개한 인공지능(AI) ‘왓슨(Watson)’은 5년 후인 2011년 세계의 주목을 받는다. 미국의 유명 퀴즈 쇼 ‘제퍼디’에서 사람, 그것도 제퍼디의 과거 챔피언 두 명을 압도적인 점수 차이로 이겨서다. 기계가 창조주인 사람을 뛰어넘는 순간을 본 수천만 명의 관객은 충격을 받는다.
성과에 고무된 IBM은 왓슨을 금융과 법률, 의료 부문에 적용한다고 밝혔다. 왓슨은 1초 만에 책 수만 권 분량의 데이터를 처리할 만큼 강력한 연산 능력을 갖췄다. 이를 잘 활용하면 사람이 풀지 못한 여러 난제를 해결할 가능성, 특히 사람의 주요 사망 원인인 ‘암’을 정복할 가능성이 있다는 기대 섞인 희망도 나왔다. 실제로 미국의 한 암 연구 센터에 설치된 왓슨은 논문 7만 편을 한 달만에 분석해 항암 유전자에 영향을 미치는 단백질을 찾는 성과를 올렸다.
하지만, 왓슨이 퀴즈로 사람을 꺾은 지 7년 후인 2018년 5월, IBM은 왓슨을 실패한 사업으로 규정하고 팀을 구조조정한다고 밝혔다.
뉴욕 타임즈는 왓슨의 실패 원인으로 ‘암 관련 데이터가 너무 복잡했고 잘못된 진단, 의사의 개인적 표현 등 오염된 데이터까지 더해져 왓슨의 성능을 높이는 것을 방해했다’고 분석했다. 왓슨이 나라마다 조금씩 다른 임상 데이터를 제대로 배우고 또 실무에 적용하지 못한 점도 원인으로 꼽혔다.
왓슨의 실패 소식은 세계 AI 업계에 경종을 울렸다. 퀴즈 쇼에서 사람을 꺾을 만큼 성능이 우수한 AI도 데이터와 실증 없이는 제대로 된 역할을 할 수 없다는 점을 증명했다.
이렇듯 데이터는 AI의 성능과 활용 범위를 결정한다. 데이터가 많을 수록 더 다양한 작업을 단시간에 정확히 할 수 있다. 단, 그냥 데이터가 아니라 오염되지 않은 ‘잘 가공된 데이터’라야 한다. 그래야 왓슨처럼 실패하지 않고 제대로 동작한다. 나아가 이들 데이터로 만든 AI 모델의 실증을 여러 번 거쳐야 한다. 그래야 데이터 안에 섞인 불순물을 거르고, AI의 오류와 단점을 찾아 해결 가능하다.
전라남도 광주 인공지능산업융합사업단(AICA)의 곽재도 본부장이 AI 기업의 성공 조건으로 강조하는 것이 AI 경험을 많이 쌓은 인재, 그리고 잘 가공된 데이터다. 지난 기사에서 소개한 광주 인공지능사관학교, AICA의 AI 취업 및 창업 프로그램은 AI 경험을 많이 쌓은 인재를 기르는 프로그램이다. AICA가 광주광역시에 마련하고 있는 국가 AI 데이터 센터와 AI 융합형 실증 지원 서비스는 잘 가공된 데이터를 만들고 또 활용할 방안이다.
한국판 뉴딜 선도할 세계 규모의 국가 AI 데이터 센터가 광주에
우리나라는 코로나19 팬데믹으로 침체된 경기를 회복하고 세계 경제를 선도하기 위한 한국판 뉴딜(New Deal, 산업 구조를 개혁해 경제 부흥을 꾀하는 정책)을 진행 중이다. 이 가운데 주목 받는 것이 ‘D(Data)N(Network)A(AI)’ 생태계 강화다. 데이터와 네트워크, AI를 모든 산업 및 경제 부문에 적용해 나라 차원의 디지털 전환과 혁신을 이끈다는 계산이다.
특히 상상을 현실로 만드는 기술 AI는 한국판 뉴딜의 핵심 기술로 손꼽힌다. 여러 부문에 AI를 적용하려면 그만큼 다양한 데이터와 실증 실험 결과가 있어야 한다. 기본은 데이터 댐이다. 물을 저장해 뒀다가 적재적소에 공급하는 댐처럼, 데이터 댐은 다양한 데이터를 보관하다가 필요한 기업이나 산업 부문에 공급하는 역할을 한다. 우리나라의 데이터 댐이 바로 광주 인공지능산업융합단지에 설치될 ‘국가 AI 데이터 센터’다.
AICA가 구축할 국가 AI 데이터 센터는 한국 최대 규모를 넘어 세계의 유명 AI 데이터 센터와 견줄 만큼의 실력을 2024년까지 갖추게 된다.
우선 숫자로 따져보자. 2024년 이 곳에 설치될 슈퍼 컴퓨터의 계산 능력은 1초에 8경8500조 번, 88.5PF(PetaFlops, 페타플롭스, 1PF는 초당 1000조 번)다. 2021년 기준 우리나라에서 가장 강력한 슈퍼 컴퓨터, 기상청의 ‘마루’의 계산 능력 16PF를 압도한다. 그만큼 다양한 데이터를 빠르게 처리한다. 저장 공간 크기도 107PB(Peta Byte, 페타바이트, 1PB는 1024TB)에 달할 정도로 방대하다.
이 저장 공간에는 정부 기관이 제공 및 공개 중인 주요 데이터는 물론 기업과 공공 데이터가 모두 저장된다. AICA는 후술할 AI 실증 지원 서비스, 공동 기획 과제 등 데이터 확보 방안을 세울 예정이다. 데이터 맵, 민간과 공공 데이터 활용 구역과 유통 플랫폼도 기획 중이다.
우리나라 AI 기업은 국가 AI 데이터 센터에 저장된 방대한 데이터와 고성능 인프라를 손쉽게, 마음껏 쓸 수 있다. 슈퍼 컴퓨터급 성능을 가진 AI 가속기와 50TB 대용량 스토리지, 폭넓은 개발 환경도 주어진다. AICA는 개발 언어와 프레임워크를 다양하게 마련해 AI 기업의 접근성을 높였다. 얼굴 인식과 문자 및 이미지 검색, 음성 인식과 합성 등 응용 가능한 AI 솔루션은 물론 보안 서비스까지 제공된다.
위 설비들은 AI 기업의 요구나 수요, 필요에 따라 언제든 AICA에 신청해 쓸 수 있다. AICA는 나아가 AI 기업이 국가 AI 데이터 센터를 활용한 후 모니터링을 거쳐 부족한 부분을 교육 등 프로그램으로 지원한다. AICA는 AI 기업이 요구하는 설비와 정책, 교육 등을 수시로 듣고 최대한 보충할 예정이라고 강조했다. 이를 통해 2024년까지 1554개 이상의 AI 과제를 돕는 것이 목표다.
이미 국가 AI 데이터 센터를 활용해 성과를 거둔 AI 스타트업도 있다. 축산 AI 솔루션 스타트업 인트플로우다. 인트플로우는 국가 AI 데이터 센터의 막대한 자원력과 연산 성능을 활용해 1주일이 걸리던 AI 학습과 개발 시간을 불과 20시간 쯤으로 줄였다.
전광명 인트플로우 대표는 “광주광역시 국가 AI 데이터 센터의 집적도는 단번에 체감할 정도로 우수하다. AI 학습 자원도 많고 데이터 누적 공간도 넓다. 다른 AI 기업이 이곳의 AI 생태계에 참여해 연구 개발과 사업을 이어나가면 학습 데이터는 더 빠르게 쌓일 것이다. 모두가 함께 AI 데이터를 쌓으면 더 많은 기업이 AI 아이디어를 현실화할 것으로 기대한다.”고 밝혔다.
곽재도 본부장은 “국가 AI 데이터 센터는 나라가 주도하는 사업이 아니라, AI 기업이 원하는 것을 나라가 가져다주는 사업이다. AI 기업에게 필요한 모든 솔루션을 제공해 꿈 꾸던 비즈니스모델을 현실로 만들도록 도울 것이다. 그래야 우리나라 AI 산업계 자체의 역량을 강화하고 경험 있는 AI 인재도 키우는, 바람직한 생태계가 만들어진다. 기업이든 사람이든, 광주에 오면 꿈 꾸던 AI 기능을 현실로 이루도록 돕겠다.”고 밝혔다.
국가 AI 데이터 센터에서 연구하고, AI 융합형 실증 지원 서비스로 실험하고
잘 가공된 데이터가 AI 기업의 성공을 보장하는 것은 아니다. 풍부한 데이터에 아이디어, 기술을 더해 AI 사업 모델을 만드는 그 순간이 오히려 시작이다. 수많은 실증을 거치면서 오류를 고치고 기능을 강화해야 비로소 완성도 높은 AI 사업 모델이 된다.
광주 인공지능산업융합단지에는 기업이 AI 사업 모델을 마음껏 활용하도록 돕는 ‘AI 융합형 실증 지원 서비스’도 마련된다. AI 기업이 만든 제품이나 서비스의 안정성, 성능 평가를 각종 설비와 지원 정책으로 돕는 서비스다.
AICA가 마련한 AI 융합형 실증 지원 서비스는 자동차, 에너지, 헬스케어 세 부문으로 나뉜다. 모두 우리나라의 주요 산업인 동시에 AI와 큰 시너지를 낼 것으로 기대되는 산업이다. AICA는 서비스의 품질을 높이고 지역 주력 산업과 AI 기업과의 융합을 이루기 위해 자동차 부문은 광주그린카진흥원, 에너지 부문은 한국광기술원, 헬스케어 부문은 광주테크노파크와 함께 한다.
AI 융합형 실증 지원 서비스 자동차 부문에는 드라이빙 시뮬레이터와 차량 데이터 수집 장비, 스마트자동차 환경 시험 장비가 배치된다. 에너지 부문에는 AI 에너지 고장진단과 탐지 및 분석 장비, 에너지 데이터 분석과 운영 장비가 들어선다. 헬스케어 부문에도 신체 데이터 수집 장비를 포함한 의료 지원과 병원 연계 시스템이 마련된다. 국가 AI 데이터 센터의 운영 방안과 동일하게, AICA는 AI 시장 유행에 따른 수요를 조사한 후, 이 수요를 토대로 AI 기업이 원하는 장비나 시스템을 2024년까지 77종 확보할 예정이다.
AI 기업이 AI 융합형 실증 지원 서비스를 받아 사업 모델을 실증하고 고도화한다. AICA는 이 실증 데이터를 수집, 분석하고 AI 기업에게 알맞은 지원 패키지를 맞춤형으로 제공해 성과를 내도록 돕는다. 지원 패키지는 기술 컨설팅과 장비 활용 지원, 데이터 연구 개발과 실증 지원 등으로 구성한다.
AI 융합형 실증 지원 설비와 AI 기업의 만남은 AI 혁신 기술뿐 아니라 새로운 제품과 서비스를 개발하는 원동력이 될 것이다. AICA는 이 구조를 활용해 AI 기업이 자율주행차 부품과 알고리즘, 자율주행 시나리오 등을 만들 것을 기대한다. 레벨 4 이상의 자율주행차 개발, 자율주행차의 안전성 평가 기준 확립도 도울 전망이다.
신재생 에너지 설비의 고장 진단과 공공 건물의 제로 에너지, 에너지 거래 시스템 구현도 목표 중 하나다. 기업이 AI 에너지 실증 센터에서 쌓은 각종 에너지 데이터는 우리나라가 세계 에너지 경쟁에 나설 때 든든한 무기가 될 것이다.
고령화, 1인 가구 사회에 대비한 AI 헬스케어 의료 지원과 예측·진단·치료 서비스도 광주광역시 인공지능산업융합단지에서 탄생할 전망이다. AICA는 AI 의료 데이터를 시민 의료 앱과 의료 기업, 보건소 등에 제공해 지역 의료 서비스 품질을 높이려 한다.
우리나라 지자체 가운데 광주광역시가 처음 시도하는 AI 헬스케어 의료 지원 계획이 이뤄지면, 지방의 의료 낙후 현상과 크게 늘어난 고령자 관리 모두를 해결할 것으로 기대된다.
AICA “사람 중심 AI 기술과 데이터 공유·개방, 혁신 세 마리 토끼 잡는다”
AICA는 지금까지와는 다른 방식으로 광주 인공지능융합산업단지를 운영하겠다고 강조한다. 우선 AI 기업이 체질을 근본부터 바꾸도록 자금과 서비스를 지원한다. 지금 우리나라의 AI 기업 상당수는 소프트웨어 기업의 속성을 유지하는 탓에 발전하지 못한다.
AI 기업은 소프트웨어 기업과 다르다. 소프트웨어 기업은 소스 코드와 디버그를 거쳐, 오류를 수정하는 패치 작업의 비중이 가장 크다. 반면, AI 기업은 AI 모델을 만들고 초기 데이터로 가르치는 작업의 비중이 압도적으로 크다. 패치, 즉 재학습의 비중은 10% 남짓으로 적다. 따라서 초기 데이터로 좋은 AI 모델을 만드는 것이 무엇보다 중요하다.
AICA는 민관협력과 AI 전문 코디네이터를 통해 AI 기업의 변화를 이끌고 산업계와의 융합을 시도한다. 기술 성장과 해외 진출도 적극 장려한다.
운영 계획을 유연하게 운용하는 것도 AICA의 전략이다. 매년 하던 계획을 똑같이 반복만 하면 발전을 이룰 수 없다. AICA는 시시각각 바뀌는 세계 AI 업계의 흐름에 기민하게 대응하는 한편, 국내 AI 기업의 목소리를 받아들여 운영 계획을 수시로 변경할 예정이다. AI 기업의 수요에 맞는 기술과 설비 도입도 검토한다.
이렇게 AI 기업의 체질을 개선하고 현장의 요구에 따라 탄력적으로 시설을 운용하면 AI 산업 생태계가 조금씩 만들어진다. AICA는 AI 기술을 원하는 수요자와 그 기술을 제공하는 AI 기업, AI 기술 경쟁자와 보완 기술 생산자 등 AI 산업 관계자들을 광주광역시 국가 AI 융복합단지에 모아 클러스터를 만들려 한다.
곽재도 본부장은 “AI는 한국판 뉴딜, 디지털 뉴딜을 선도하는 기술이다. 광주광역시와 AICA는 AI 기업과 산업 관계자를 모아 살아 움직이는 생태계를 만들 것이다. 사람 중심의 AI 기술, 데이터 공유와 개방으로 혁신을 이루겠다. 역동적, 창의적으로 세계화를 이끌겠다.”고 밝혔다.
글 / IT동아 차주경(racingcar@itdonga.com)