"왜 사람이 차를 운전해야 합니까? 기계가 운전하는 것이 더 안전한데"
[IT동아 강일용 기자]
"왜 사람이 차를 운전해야 합니까? 사람은 (운전 도중) 쉽게 피로를 느끼고, 집중력이 흐트러지기도 합니다. 하지만 기계는 그렇지 않습니다. 앞으론 기계가 인간보다 자동차를 더 잘 운전하게 될 것입니다. 기계한테 맡기십시오. 기계가 운전하는 것이 더 안전합니다."
몽상가의 발언이 아니다. 무인자동차 업계의 선두주자 구글의 대표가 한 말이다. 알파벳(구글의 지주회사)의 회장 에릭 슈미트(Eric Schmidt)는 지난 10일 매직인더머신(Magic in the Machine) 행사에서 기자들에게 이렇게 폭탄 선언을 했다. 슈미트 회장은 '모바일'의 뒤를 이을 차세대 IT 화두로 머신러닝(기계학습, Machine Learning)을 지목하고, 머신러닝이 발전하면 발전할 수록 사람들은 단순 업무 대신 창의적인 일에 집중할 수 있을 것이라고 강조했다.
머신러닝이란 이름 그대로 기계에게 학습할 수 있는 능력을 주는 기술이다. 사람은 학습을 통해 스스로를 더욱 발전시킬 수 있다. 머신러닝도 마찬가지다. 기계에게 데이터(학습)를 제공해 성능을 더욱 향상시키는 것이다. 기계의 성능이 향상되는 만큼 기계가 제공하는 서비스의 품질도 함께 향상된다. 기계에게 지능을 주는 기술인 '인공지능'과 유사한 점이 많다. 과거에는 기계의 성능을 향상시키려면 사람이 일일이 소프트웨어를 개발하고 이를 추가해야 했다. 반면 머신러닝을 활용하면 기계가 데이터를 수집하고 스스로의 성능을 더욱 개선할 수 있다.
슈미트 회장은 구글이 머신러닝 업계의 선두주자라고 설명했다. 딥마인드(Deep Mind) 등 인공지능 관련 업체를 인수하고, 옥스포드 대학과 협력해 머신러닝 관련 연구를 진행하고 있다. 구글 내부에선 100개 이상의 팀과 수천 명의 엔지니어들이 머신러닝 관련 개발에 집중하고 있다.
<에릭 슈미트 알파벳 회장>
머신러닝은 구글의 서비스에 어떤 형태로 도입됐을까? 지난 2008년 텍스트를 음성으로 변환해주는 구글 스피치 서비스에 최초로 도입됐다. 2013년부터는 전사적으로 머신러닝을 활용하기 시작했다. 지금은 모든 구글 서비스에 머신러닝이 적용된 상태다.
머신러닝 덕분에 두 가지 서비스가 등장할 수 있었다. 구글 포토(Google Photos)와 무인자동차다. 구글포토는 머신러닝을 활용해 사진을 분석한 후 사진을 종류별로 자동 정리해준다. 사용자는 단지 사진을 업로드하기만 하면 된다.
구글 무인자동차는 머신러닝 기술의 총아다. 신호 감지, 도로 감지, 센서 제어, 주행 제어 등 무인자동차를 구성하는 모든 분야에 머신러닝이 적용됐다. 특히 구글은 무인자동차를 현실화하기 위해 '도로 위 신호가 폭설, 폭우 같은 악천후 때문에 50% 밖에 파악되지 않더라도 남은 50%를 분석해 신호를 정상 인식할 수 있는 기술'을 머신러닝을 활용해 개발했다.
구글의 다른 서비스도 머신러닝을 활용해 성능이 획기적으로 향상됐다. 구글 번역기의 사례를 들어보자. 머신러닝을 적용하자 23%에 달하던 오류 발생 비율이 8%대로 줄어들었다. 구글 검색에 머신러닝을 적용함으로써 검색 결과의 품질도 향상시킬 수 있었다. 과거에는 구글 이미지 검색에 ‘고양이’라고 검색하면 사진 이름 또는 본문에 고양이라는 단어가 있는 경우에만 찾을 수 있었다. 이제는 다르다. 머신러닝을 통해 이미지를 분석한 후 고양이로 판단되는 이미지가 섞여 있으면 해당 이미지도 검색 결과로 함께 보여준다.
구글은 지난 9일 오픈소스 머신러닝 엔진 '텐서플로'를 공개했다. 텐서플로는 구글 내부에서 사용되는 머신러닝 기술을 타사와 대학 등 연구기관이 사용할 수 있게 한 것이다. 구글은 왜 텐서플로를 오픈소스로 공개한 것일까. 슈미트 회장은 텐서플로를 통해 머신러닝 시장이 발전하면 발전할 수록 구글의 머신러닝 기술도 함께 발전할 것이라고 공개 이유를 밝혔다. 구글 혼자 머신러닝을 연구하는 데에는 한계가 있다. 다른 기업, 대학, 연구소가 머신러닝과 텐서플로를 연구하면 연구할 수록 머신러닝 시장도 함께 발전할 것이고, 궁극적으론 구글의 이익도 함께 늘어날 것이란 설명이다.
슈미트 회장은 머신러닝이 발전함에 따라 우리의 삶도 크게 변할 것이라고 강조했다. 그는 "1950년 대에는 사람들이 직장에 출근해 단순 작업을 반복했다. 기술이 발전함에 따라 오늘 날에는 단순 작업 가운데 상당수가 사라졌다. 2050년도 마찬가지다. 머신러닝이 발전함에 따라 기계와 컴퓨터가 우리 대신 단순 작업을 반복할 것이다. 사람들은 단순 작업 대신 더욱 생산적이고 더욱 창의적인 일에 집중할 수 있게 될 것"이라고 말했다.
다음은 머신러닝의 현황에 관한 질문에 슈미트 회장과 그렉 코라도(Greg Corrado) 구글 머신러닝 선임연구원이 한 답변을 1문 1답의 형태로 정리한 것이다.
Q. 머신러닝이 계속 발전하기 위해 해결해야 하는 과제는 무엇인가?
A. 상황 시나리오를 여러 개 만들고, 이 가운데 틀린 시나리오를 걸러내는 기술이 필요하다. 잘못된 시나리오는 머신러닝의 정확성에 의구심이 들게 하기 때문이다.
Q. 머신러닝의 최종 목표는 무엇인가?
A. 아직은 알 수 없다. 20~30년은 지나봐야 알 수 있을 것이다. 개인적으론 논문을 대신 작성해주는 기계가 출현하는 것을 목표로 하고 있다. 컴퓨터가 물리학을 배운 후 물리학 논문을 작성할 수 있게 되면 근사할 것이다. 아마 내가 살아있는 동안에 가능해질 것이다. (참고로 슈미트 회장은 올해로 60세다.)
Q. 머신러닝을 구현하기 위해 가장 중요한 것은 무엇인가?
A. 데이터다. 수많은 데이터를 수집한 후 평균값을 산출함으로써 기계가 보다 정확한 판단을 할 수 있게 해줘야 한다. 또한 사용자의 사생활을 보호하는 것도 데이터 수집 못지 않게 중요하다. 사용자의 비밀과 사생활을 보호하면서 머신러닝을 구현하는 것이 구글의 가장 큰 과제다. 예를 들어 구글 포토의 경우 정기적으로 사용자의 개인정보가 제대로 보호되고 있는지 관찰하고 있다.
Q. 머신러닝 발전을 위해 사용자들이 할 수 있는 일이 있는가?
A. 사용자들은 머신러닝이 적용된 서비스를 이용하는 것만으로도 머신러닝 기술 개선에 기여할 수 있다. 사용하는 것만으로도 데이터를 생성하기 때문이다.
Q. 구글 포토는 쌍둥이의 얼굴을 어떻게 구분하고 있는가?
A. 사실 나도 쌍둥이를 제대로 구분하지 못한다. 사람이 이런데 기계는 어떻겠는가. 쌍둥이를 구분하는 것은 대단히 까다로운 작업이다. 구글 내부에서 심혈을 기울여 연구 중이다.
글 / IT동아 강일용(zero@itdonga.com)