[기고] 인공지능 중심의 디지털 트랜스포메이션 접근법 (2)

이문규 munch@itdonga.com

[IT동아]

1부에서는 최근 디지털 트렌스포메이션의 열풍과 함께, 그 배경으로서 '커넥티비(연결성)의 증가'와 '데이터 수집 분석'을 통한 제품/서비스 분야의 혁신이 작용하고 있음을 확인했다. 특히 클라우드 컴퓨팅 기술은 데이터 수집, 저장은 물론 데이터 분석, 인공지능, 머신러닝 등의 기술 도입 장벽을 낮춤으로써 기업의 디지털 트랜스포메이션의 핵심 역할을 수행하고 있다. 여기서는 인공지능 기술을 토대로 디지털 트랜스포메이션을 지원하는 AWS의 3가지 접근 방향을 소개한다.

(1) 머신러닝 인프라 서비스의 활용

이는 모든 머신러닝 모델을 직접 구축하고 학습시키며 배포까지 하는 경우다. 이러한 접근 방향은 일반적으로 데이터를 충분히 이미 보유하고 있으며, 이를 비즈니스에 적합하게 직접 다룰 수있는 데이터 기술자나 머신러닝 엔지니어를 상당히 확보한 기업에 해당된다.

대개 고성능 GPU 인프라를 사용하는 경우가 많은데, 아마존 P3 장치(인스턴스)의 경우, 머신러닝을 위한 최대 100Gbps의 네트워크 대역폭과 최대 8개의 NVIDIA V100 Tensor Core GPU를 통해 클라우드에서 고성능 컴퓨팅을 보장한다. 이는 머신러닝 시간을 대폭 단축하고, 고성능이 필요한 시뮬레이션 수를 3-4배 증가시키는 것으로 입증되었다. 또한 최근 소개된 P3dn 장치는 P3에 비해 네트워크 대역폭이 최대 4배로 늘어나 분산 머신러닝과 HPC 애플리케이션에 최적화됐다.

에어비엔비, 세일즈포스, 웨스턴디지털 등의 글로벌 기업이 현재 AWS의 머신러닝 인프라 서비스를 활용하고 있다. 특히 토요타가 2015년 실리콘밸리에 설립한 연구기관인 'Toyota Research Institute'는 아마존의 P3 장치를 자율주행 차량 소프트웨어 연구개발에 활용해, 모델 학습 시간을 기존에 비해 75% 절감했다고 발표했다. 이 연구기관은 P3 장치 뿐 아니라 아마존 엘라스틱서치(Amazon Elasticsearch), AWS 람다(Lambda), 아마존 RDS(Amazon RDS) 등의 AWS 서비스를 연구개발에 활용하고 있다.

국내 기업 역시 머신러닝 인프라 서비스를 적극 활용하고 있다. SK텔레콤은 고객들의 청취 로그를 분석, 학습에 활용할 수 있도록 전처리를 수행하고 아마존 S3 장치에 주기적으로 저장하며, 이러한 데이터를 P3 장치로 학습 처리해 음악 스트리밍 서비스인 FLO의 추천 서비스에 적용하고 있다. SK텔레콤은 추천 서비스 구현을 위한 인프라를 직접 관리하기 보다는, 자사 고객이 사용하는 서비스 성능 향상에 집중하는데 머신러닝 인프라 서비스를 활용한다.

SK텔레콤의 사용자 콘텐츠 기반 필터링 및 학습
개요도(출처=아마존)
SK텔레콤의 사용자 콘텐츠 기반 필터링 및 학습 개요도(출처=아마존)

(2) 머신러닝 서비스 활용

두 번째 접근 방향은, 머신러닝 과정에 있어 불필요한 작업을 줄여줌으로써 효율적으로 작업을 수행하도록 하는 머신러닝 서비스 활용이다. 실제로 많은 이들이 머신러닝 모델 구현을 위해, 구축/학습/배포 각 단계 별로 다양한 환경을 직접 관리하고 최적화해야 하는 어렵고 번거로운 과정을 거친다. AWS는 이 과정을 세 단계로 모듈화한 '아마존 세이지메이커(SageMaker) 서비스'를 제공하고 있다.

세이지메이커는 전체 머신러닝 워크플로를 포괄하여 데이터를 분류 및 준비하고, 알고리즘 선택, 모델 학습, 배포를 위한 조정 및 최적화, 예측 수행 및 작업을 수행하는 완전 관리형 서비스다. 특히 2018년 말에 소개된 'SageMaker Ground Truth'를 활용하면, 작업자가 지정한 레이블을 통해 학습해 고품질 자동 주석이 생성되어, 라벨링(분류작업)에 드는 비용과 시간을 낮출 수 있다.

또한 기존의 TensorFlow, MXNet, PyTorch, Horovod, Keras 등을 자동 구성, 최적화하며, 일반적으로 사용되는 머신러닝 알고리즘도 기본 제공한다. 여러 사용자들이 구축한 200개 이상의 사전 학습모델과 알고리즘을 AWS 마켓플레이스에서 내려받아 사용할 수도 있다.

특히 도커(Docker) 컨테이너에 구축함으로써 다른 알고리즘이나 프레임워크를 가져올 수 있는 점, 하이퍼파라미터(hyperparameter)를 최적화하는 기능이 제공되는 점이 특징이다.

아마존 세이지메이커의
특징(출처=아마존)
아마존 세이지메이커의 특징(출처=아마존)

머신러닝을 어느 정도 잘 활용하고 있는 리테일, 제조, 금융 등의 분야를 넘어 다양한 산업군에서도 머신러닝이 확산되고 있다. 5억 명 이상의 팬을 보유하고 있는 F1 레이싱 스포츠는 아마존 머신러닝 서비스를 통해 비즈니스 패러다임을 바꾸고 있는 대표적인 사례다. 레이싱 차량 내 120여 개의 센서에서 초당 3GB 규모의 데이터를 수집하여 머신러닝에 적용한다. 이를 통해 선수들의 추월 확률을 예측하고, 타이어 마모 상태 등을 토대로 교체 시점 등을 판단하는 정보를 제공한다. 나아가, 데이터를 분석, 활용함으로써 경기 포맷, 트랙 디자인 등을 개선하는 데에까지 활용범위를 확장하고 있다.

F1 Insights 분석화면
예시(출처=아마존)
F1 Insights 분석화면 예시(출처=아마존)

미국 메이저리그(MLB)와 내셔널 풋볼리그(NFL)에서도 아마존 세이지메이커를 활용한 서비스를 제공하고 있다. 메이저리그에서는 선수들의 도루 성공율을 예측하기도 하고, 수작업으로 진행되던 점수기록, 투구 분류 등을 머신러닝 모델을 토대로 수행하고 있다. 내셔널 풋볼 리그 역시, 각 경기장과 선수들의 어깨 패드에 설치된 센서들을 통해 수집되는 데이터를 토대로 'Next Gen Stats'라는 서비스를 제공하고 있으며, 경기 결과, 경로, 포메이션 등을 예측하는 데에 활용되고 있다.

이렇게 스포츠 산업 분야에 머신러닝 기술이 적용되면, 경기장에 직접 가지 못하는 팬들이 시청하는 미디어 화면을 토대로 기존과는 다른 새로운 모터 스포츠의 패러다임을 제공할 수 있다. 실제로 내셔널 풋폴리그의 경우, 1억 8천만 명의 팬 중에서 실제로 경기장을 찾는 팬은 1천 7백만 명에 불과한데, 약 90%의 고객은 각종 미디어 채널을 통해 경기를 즐기고 있다.

한편 국내에서는 금융사기 수법을 해결하는 데에도 머신러닝 서비스가 활용된다. KB 국민은행은 월 평균 2만 건 이상의 피해가 발생하고 있는 스미싱(문자메시지를 통한 금융 사기 수법)을 세이지메이커 기반의 머신러닝 모델을 통해 자동으로 탐지하는 서비스를 금융감독원과의 협업을 통해 선보였다.

지능형 스미싱 API(응용 프로그램 인터페이스)는 다른 금융 회사 및 통신사, 보안 전문업체 등에 무상으로 제공 및 공개될 예정으로, 참여사들이 계속 늘어날 것으로 기대된다. 알고리즘 개발을 주도한 KB국민은행 구태훈 부서장은 "데이터 기획에 있어서 AWS는 최적의 실험실"이라 평가한 바있다.

KB국민은행 아키텍처(출처=아마존)
KB국민은행 아키텍처(출처=아마존)

(3) 인공지능 서비스의 활용

마지막, 세 번째 접근 방향은, 머신러닝 기술이 없어도 사용이 가능한 인공지능 서비스의 활용이다. AWS의 경우 대부분의 산업에 적용될 수 있는 비전, 음성, 언어, 챗봇, 예측, 추천 서비스를 제공하고 있다. 인공지능 서비스는 미리 충분한 데이터를 통해 학습한 머신러닝 모델을 토대로 서비스를 제공하기 때문에, 사용자가 직접 학습을 수행할 필요가 없다. 또한 사용자의 기존 앱과 작업과정에 어렵지 않게 추가할 수 있으며, 서비스 품질 향상에 집중하고 있어 사용자는 효율적이고 안정된 성능으로 작업을 처리할 수 있다.

인공지능 언어 서비스는 텍스트를 음성으로 바꾸는 서비스, 음성을 텍스트로 바꾸는 서비스, 번역 서비스, 텍스트 내 관계/인사이트 탐색 서비스, 챗봇 서비스 등으로 구성돼 있다. 이들 서비스는 해당 언어에 대한 데이터가 충분히 확보되어 학습도 완료되어 있어 사용자가 따로 머신러닝 기술을 적용할 필요가 없다.

대표적인 예로, 글로벌 보험사인 리버티뮤추얼(Liberty Mutual)은 전 세계 800여 개 지역에서 내부 직원들의 업무 효율성을 극대화하기 위해 아마존 렉스(Amazon Lex) 서비스를 토대로 '디지털 어시스턴스(Digital Assistant)'라는 챗봇 서비스를 구축했다. 이를 통해 실시간으로 HR, IT헬프 데스크 등의 주제에 해당하는 정보를 채팅 형태로 묻고 답을 얻을 수 있게 됐다.

국내의 경우 조선일보와 CBSi 노컷뉴스는 아마존 폴리(Text to Speech) 서비스를 적용해 '읽어 주는 뉴스' 서비스를 제공하고 있다. 특히 CBSi 노컷뉴스는 각 섹션 별 차별화된 음성 톤을 적용, 제공하고, 최근에는 기사 스피치 전후에 광고를 삽입하는 서비스도 구현해 새로운 수익모델 창출에 나섰다.

음성을 텍스트로 바꿔주는 아마존 트랜스크라이브(Amazon Transcribe) 서비스의 경우, 특히 콜센터 상담, 동영상 자막 생성, 미팅에 대한 요약 등에 주로 활용된다.

이렇게 다양한 종류의 인공지능 언어 서비스는 복합 활용될 때 효과가 더욱 좋다. 실제로, GE 얼라이언스는 매월 수 백만 분 분량의 고객 통화를 대응하고 있는데, 아마존의 커넥트(콜센터 서비스), 렉스, 폴리 서비스들을 사용하여 제품 정보 조회 등 간단한 작업을 자동화했고, 아마존 트랜스크라이브를 이용해, 텍스트로 변환된 콜센터 통화 내역을 지속적으로 분석해 업무 프로세스를 개선하고 있다.

아마존 커넥트, 트랜스크라이브, 트랜스레이트, 컴프리핸드 등이 적용된 콜센터
사례(출처=아마존)
아마존 커넥트, 트랜스크라이브, 트랜스레이트, 컴프리핸드 등이 적용된 콜센터 사례(출처=아마존)

영상 인식(비전) 서비스 역시 그 적용 범위가 확장되고 있다. 국내 케이스타그룹은 '페이스 티켓(Face Ticket)'이라는 콘서트 티켓 서비스를 개발했다. 이는 콘서트 티켓 구매자의 얼굴을 아마존 레코그니션(Amazon Rekognition) 서비스를 통해 인식해 티켓을 제공하는 기술이다. 티켓 구매자가 콘서트장 입구에 들어가면 시스템이 티켓 구매자의 얼굴을 알아보고 별도의 인증절차 없이 바로 입장시킨다.

주목할 것은 기존에 검증된 기술 기반의 인공지능 서비스 역시 확대되고 있다는 점이다. 아마존 포캐스트(Amazon Forecast) 서비스의 경우, 아마존닷컴에 사용된 것과 동일한 기술에 기반을 두어 정확한 예측 서비스를 제공한다. CJ 대한통운은 아마존 포캐스트를 택배 물량 예측에 활용하고 있다.

아마존 퍼스널라이즈(Amazon Personalize)는 아마존닷컴에서 사용한 기술에 기반한 실시간 맞춤 추천 서비스로, 단순 API 호출을 통해 추천을 구현하는 서비스다. 도미노 피자는 고객의 개인별 상황과 조건을 적용한 맞춤형 정보를 제공하는 서비스에 이 아마존 퍼스널라이즈를 적용했다. 고객의 위치, 구매 습관 및 이전 구매 시 할인 금액 등을 분석해 적절한 모바일 앱 알림을 선택할 수 있다.

Start Small, Learn Fast, and Think Big!

인공지능, 머신러닝 기술을 얼마나 빠르게, 그리고 효과적으로 기존 비즈니스에 녹일 수 있느냐가 디지털 트랜스포메이션의 핵심 성공 요인이다. IDC 보고서에 따르면, 2019년의 디지털 트랜스포메이션 이니셔티브의 40%는 이미 인공지능 기술을 기반으로 한다는 조사 결과도 있다.

앞서 소개한 대로, 인공지능, 머신러닝 기술은 각 기업의 비즈니스 특성과 기술 역량에 따라 서로 다르게 적용할 수 있도록 다양한 형태로 제공된다. 완벽한 인력과 역량을 보유해야 인공지능을 활용할 수 있는 게 아닌 만큼, 비즈니스 차별화와 내부 효율성 극대화를 위해 필요한 기술이 무엇인지를 고민하는 게 최우선이다.

이를 토대로 MVP(Minimum Viable Product, 최소 기능 제품)를 빠르게 발굴, 적용함으로써, 향후에 사업을 근본적으로 바꿀 수 있는 중요한 아이템을 찾는 과정이 필요하다. 이러한 테스트를 자유롭게 수행하기에 최적의 장소는 단연코 클라우드 환경이다. 클라우드를 통해 불필요한 작업을 최소화하고, 비즈니스 핵심에 집중하는 것이 필요한 시점이다.

글 / 아마존웹서비스(AWS) 사업개발 담당 김선수

AWS 내 유망기술(Emerging Tech) 인큐베이션 및 사업개발을 통해, AWS 고객사가 디지털 트랜스포메이션을 원활히 진행하도록 돕고 있다. 현대자동차, LG전자, 삼성SDS 등에서 커넥티드카, 빅데이터, 스마트시티 부문의 신사업개발, 전략기획, 컨설팅을 담당했다.

정리 / IT동아 이문규 (munch@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.