컴퓨터가 세상을 학습하는 시대가 왔다
[IT동아 이상우 기자] 한국마이크로소프트(한국MS)가 클라우드 기반 데이터 분석/예측 기술인 '마이크로소프트 애저 머신 러닝(Microsoft Azure Machine Learning, 이하 MS애저 ML)'을 국내에 공식적으로 선보이고, 머신 러닝의 개념과 실제 적용 사례에 대해 소개했다.
머신 러닝이란?
'머신 러닝'이란 이름 그대로 기계가 학습한다는 뜻이다. 여기서 기계란 컴퓨팅 시스템, 알고리즘, 소프트웨어 등을 말한다. 이 기계가 다양한 데이터를 수집해 이를 학습하고, 예측 모델을 만든다. 이를 통해 현재 상황을 바탕으로 앞으로 일을 예측한다는 의미다. 이 개념을 적용한 영화도 있다. 2008년 개봉한 영화 '이글아이'에 등장하는 슈퍼컴퓨터 '아리아'는 각종 장비를 이용해 정보를 수집하고 이를 바탕으로 테러나 범죄를 예측한다(물론 영화에서는 이 슈퍼컴퓨터가 폭주해 인간을 공격한다).
머신 러닝은 '빅데이터'나 '데이터 마이닝' 그리고 '인공지능'과는 조금 다른 개념이다. 빅데이터란 정리되지 않은 모든 데이터를 수집하고, 여기서 의미 있는 통계자료를 내는 일이다. 그리고 데이터 마이닝은 수많은 데이터 중 사용자에게 필요한 데이터를 찾아내는 기술을 말한다. 머신 러닝은 이런 데이터를 바탕으로 미래 상황을 예측한다는 점에서 차이가 있다.
인공지능과도 조금은 다르다. 인공지능은 컴퓨터가 인간과 같은 사고 방식을 가지고, 인간의 패턴을 인식하는 컴퓨팅 기술을 말한다. 앞서 소개했던 영화의 슈퍼컴퓨터는 머신 러닝 기술을 적용한 인공지능이라고 볼 수 있다.
조금 거창한 듯 설명했지만, 사실 우리 주변에서 흔히 볼 수 있는 일이며, 오래전부터 등장한 개념이다. 대표적인 예로 일기예보를 들 수 있다. 일기예보는 구름양, 일조량, 온도, 습도 등의 정보를 수집한 뒤 이를 분석하고 통계를 내서 앞으로의 날씨를 알려준다.
우리가 흔히 사용하는 구글 번역 서비스 역시 머신 러닝의 일종이다. 특정 문장을 번역한 뒤 오역된 부분을 사용자가 직접 수정하면 구글 번역 알고리즘은 이를 학습하고, 다음 번역 시에는 더 정교한 결과를 보여준다. 이런 학습이 반복되면 자연어나 오타까지도 올바르게 번역해준다. 예를 들어 '생일추카해'라는 문장을 학습했다면 이를 '생일 축하해'라는 문장이라고 예측해 올바른 번역 결과를 보여준다.
구글 번역과 비슷한 사례로 '리캡차(reCAPTCHA)'가 있다. 리캡차는 오래된 책의 내용을 디지털화 하는 데 도움을 주는 프로젝트다. 종이가 낡고 글씨가 닳아서 잘 보이지 않으면 문자 판독기(OCR)이 이를 인식하기 어려운데, 이런 단어를 인간이 눈으로 보고 직접 입력하면서 데이터를 쌓는다. 이런 데이터를 통해 학습한 OCR은 다음부터 이런 형태의 단어를 인간이 입력한 단어로 인식하게 되며, 이 역시 데이터가 쌓일수록 정교해진다.
클라우드 기반의 머신 러닝, MS애저ML
MS애저 ML은 마이크로소프트의 클라우드 서비스인 MS애저에서 기본 제공하는 기능이다. 별도로 제공하는 서비스가 아니라 MS애저 사용자는 즉시 이용할 수 있다.
클라우드를 기반으로 작동하는 이유는 간단하다. 머신 러닝을 위해서는 막대한 양의 데이터 저장 공간(스토리지)과 컴퓨팅 성능(서버)이 필요하며 이를 위한 전력과 설치 공간이 있어야 한다. 당연히 구축 비용도 많이 든다. 기업 입장에서는 진입 장벽이 꽤 높은 편이다. 하지만 이를 클라우드에서 사용한다면 사용자(기업)은 이런 기반 시설을 직접 갖출 필요가 없으며, 이를 통해 총 소유비용을 절감할 수 있다.
사실 MS는 오래 전부터 머신 러닝 기술을 연구해왔다. 메일 서비스에서 스팸 메일을 걸러내기 위한 알고리즘, Bing맵 교통량 분석 예측, 키넥트(X박스의 3차원 동작 인식 장치)의 사용자 동작 감지 기능 등 다양하다. MS 관계자는 지금까지 MS의 모든 제품에 머신 러닝 기술을 적용해 왔으며, MS애저 ML은 이처럼 검증된 알고리즘을 통해 사용자에게 정확한 예측 결과를 보여줄 수 있다고 강조했다.
MS애저 ML의 실제 적용 사례는?
MS애저 ML은 빅데이터, 사물인터넷(IoT) 등과 함께할 때 더 큰 효과를 낼 수 있다. IoT를 기반으로 수많은 데이터를 수집하고, 이를 통해 예측 결과의 정확도를 높일 수 있다. 특히 IoT와 MS애저를 기반으로 각 기업에 맞는 정보를 파악하기 때문에 기업 맞춤형 솔루션을 제공할 수 있다.
이를 실제로 적용한 사례도 있다. 글로벌 엘리베이터 기업 '티센크루프 엘리베이터(Thyssenkrupp Elevator)'는 MS애저 ML을 통해 예방 정비를 실시하고, 사고를 예방하고 있다. 티센크루프는 각 엘리베이터에 센서를 부착해 속도, 모터 온도, 출입문 오작동 등 각종 정보를 수집해 이를 클라우드로 전송한다. 즉 IoT를 적용한 엘리베이터다. 이 데이터를 바탕으로 예측 모델을 만들고, 언제, 어떤 문제가 생길지 예측할 수 있으며, 이를 통해 엘리베이터에 문제가 발생하기 전에 정기 점검을 통해 수리할 수 있다. 여기서 얻는 효과는 안전성 확보뿐만 아니라 정비 기사 파견 횟수를 줄일 수 있으며, 나아가 기업 이미지까지 높일 수 있다.
MS애저 ML을 적용한 또 다른 사례는 미국 펜실베니아 주에 있는 카네기 멜론 대학이다. 여기서는 기상 예보와 실제 내부 온도 측정 자료를 활용해 건물 관리를 최적화한 '스마트 빌딩' 시스템을 도입했다. 유동 인구를 예측하고, 사람이 많이 몰리는 시간에 맞춰 냉난방 온도를 적절하게 맞춰 전력 소모를 최적화했으며, 유지보수가 필요한 부분도 미리 파악해 관리 효율성을 높였다.
MS 관계자는 "데이터가 발생하는 모든 업계와 기업이 데이터를 정형화하고, 동향을 예측하는 등 예측하여 비즈니스에 활용할 수 있도록 지원할 수 있다"며, "금융, 제조, 의료, 스포츠, 엔터테인먼트 처럼 다양한 분야에서 우수한 사례를 만들어나갈 것"이라고 말했다.
MS 애저 ML은 별도 소프트웨어나 하드웨어 설치 없이, 웹 브라우저를 통해 언제 어디서든 사용할 수 있으며, 가상머신 상의 SQL 서버나 HD인사이트(HDInsight) 등 MS애저의 여러 기능을 그대로 활용할 수 있다. 관련 내용은 MS애저 홈페이지(http://azure.microsoft.com/ko-kr/services/machine-learning/)에서 확인할 수 있다.
한국MS 김경윤 상무는 "이번 MS애저 ML은 기업과 사용자의 비즈니스 혁신을 위해 생산성과 플랫폼을 제공하겠다는 MS 전략의 하나"라며, "스타트업부터 중소기업, 대기업까지 모두 활용할 수 있으며 데이터가 발생하고 예측이 필요한 모든 분야에서 통찰력 줄 수 있다"고 말했다
글 / IT동아 이상우(lswoo@itdonga.com)