"불법 웹툰 꼼짝 마!" AI로 불법 업로더 잡는다
[IT동아 강일용 기자] 웹툰 불법 복제 및 유통으로 인한 피해액이 나날이 늘어나고 있다. 2017년을 기준으로 약 2000억 원 수준이다. 이러한 피해를 막기 위해 네이버웹툰, 레진코믹스 등 웹툰 서비스 업체들은 불법 복제 및 유통을 막기 위한 기술적인 노력을 하고 있다.
대표적인 사례가 네이버 웹툰의 ‘툰레이더(Toon Radar)’다. 툰레이더는 웹툰을 캡처한 사람이 누구인지 특정할 수 있는 코드를 웹툰에 심어서 불법 복제 및 유통을한 당사자를 추적하는 기술이다. 웹툰이 100여개가 넘는 불법 사이트에 게재되면 이를 확인한 후 평균 20분 내로 유출자를 찾아내고 재접근을 차단한다.
실제로 네이버웹툰은 툰레이더 도입 후 많은 성과를 거뒀다. 수백명의 불법 업로더를 찾아내고 밤토끼, 먹투맨 등 대표적인 불법 웹 사이트 운영자들의 꼬리를 잡는데 툰레이더가 많은 역할을 했다. 하지만 불법 웹툰과의 전쟁은 이제 시작일 뿐이다. 밤토끼, 먹투맨은 사라졌지만, 제 2의 밤토끼가 인터넷의 음지에서 자라나고 있기 때문이다.
지금도 많은 인력이 시간과 노력을 들여 불법 웹툰과 전쟁을 치루고 있다. 지루한 전쟁에서 승리하기 위해 네이버가 꺼낸 카드가 바로 인공지능(AI)이다.
불법 업로더 꼼짝마, 툰레이더 AI가 간다
30일 네이버웹툰은 웹툰 불법 복제 및 유통을 방지하기 위해 툰레이더에 이미지 추적을 위한 보는 능력(컴퓨터 비전)을 갖춘 인공지능을 적용했다고 밝혔다. 이른바 ‘툰레이더 AI(가칭)’다. 네이버웹툰에서 툰레이더 개발을 진행 중인 서충현 개발자를 만나 툰레이더 AI를 개발한 이유와 향후 발전 방향에 대해 자세히 들어봤다.
“툰레이더 AI는 캡처한 웹툰에 심어져 있는 사용자 식별 정보를 읽고 누가 불법을 저지르고 있는지 찾아낼 수 있는 인공지능이다. 기계학습, 컨볼루션 구조의 인공신경망 등 최신 인공지능 기술을 활용해 네이버웹툰 개발팀에서 직접 만들었다. 지난 6월 말 개발을 완료해 툰레이더에 적용했다.”
“인공지능이 도입되기 전에는 사용자 식별 정보를 네이버 웹툰의 인력들이 직접 ‘노가다’ 뛰는 것처럼 직접 찾아야만 했다. 워낙 정교한 데이터이다 보니 불법으로 유통된 작품 한 화를 검사하는데 20~30분의 시간이 걸렸다. 인공지능을 적용한 후 검사 시간이 15분 이하로 줄어들었다. 검사 시간도 줄일 수 있었던 것도 긍정적이지만, 무엇보다 네이버 웹툰의 고급 인력들이 불법 웹툰 추적보다 더 생산적인 작업에 집중할 수 있게 되었다는 점이 고무적이다.”
아직 불법 웹툰의 추적이 완전히 자동화된 것은 아니다. 인공지능이 찾아낸 정보를 사람이 한 번 더 검수하고 있다. 사람 손을 제법 타는 셈. 혹시라도 생길 수 있는 인공지능의 오류 때문에 생사람 잡는 것을 막기 위함이다. 하지만 지금까지 인공지능이 잘못된 결과를 낸 적은 한 번도 없었다는 것이 서 개발자가 강조하고 있는 부분이다. 네이버웹툰 사이에서도 인공지능이 오류 없이 데이터를 찾아주는 것이 매우 놀랍다는 반응이다.
(사실 보는 능력(컴퓨터 비전)을 갖춘 인공지능의 정확도는 현재 95~97%에 달한다. 사람의 정확도가 90% 내외이니, 이제 인공지능이 사람보다 사물을 더 잘 구분하는 세상이라고 평해도 무리는 없겠다. 툰레이더 AI 역시 컴퓨터 비전에 중점을 둔 인공지능 모델이다.)
인공지능을 도입함으로써 네이버웹툰이 얻은 효과가 하나 더 있다. 캡처한 웹툰에 심어져 있는 사용자 식별 정보는 고도로 암호화되어 있다. 당연히 그 생성원리는 철저하게 대외비에 부쳐져 있다. 그럼에도 불구하고 불법 웹툰 유출자들은 캡처한 웹툰을 흐릿하게 편집하는 등 사용자 식별 정보를 무력화하려는 시도를 계속 하고 있다. 때문에 네이버웹툰은 사용자 식별 정보를 넣는 방식을 주기적으로 변경하고 있다. 이를 사람이 찾던 시절에는 사람들이 새로운 방식에 익숙해지는데 많은 시간이 걸렸지만, 인공지능은 바로 새로운 방식에 따라 사용자 식별 정보를 찾을 수 있다. 업무가 더욱 효율적으로 변했고, 보안도 그만큼 철저해졌다.
<대표적인 불법 웹툰 사이트
밤토끼의 운영자 검거 후 부산경찰청에서 올린 이미지>
다음 목표는 완전 자동화와 식별 코드 업그레이드
툰레이더 AI를 다른 웹툰 서비스 업체들에게 공개해 불법 웹툰 시장을 뿌리 뽑을 계획이 있느냐는 질문에는 난색을 표했다. 아직 미완성 기술이라는 것이 그 이유다. 서 개발자는 “툰레이더 AI는 이제 막 시작된 기술로 개선해야할 부분이 매우 많고, 상당 부분이 네이버웹툰의 시스템에 최적화되어 있다. 외부에 공개하는 것은 아직 시기상조다”고 말했다.
개선해야할 부분은 아직 많다. 하지만 서 개발자는 지속적인 업그레이드로 툰레이더 AI가 할 수 있는 작업을 점점 늘려나가겠다는 포부를 밝혔다. 첫 번째는 완전 자동화다. 올해 내로 사람의 손을 타지 완벽한 자동화 데이터 검출 시스템을 만들겠다는 것. 현재는 네이버 웹툰 실시간 모니터링 팀이 불법 웹툰 사이트를 모니터링하다가 불법 웹툰이 업로드되면 이 이미지를 인공지능에 넘겨줌으로써 유출자를 찾아내는 방식으로 일하고 있었다. 향후에는 툰레이더 AI가 직접 불법 웹툰 사이트를 모니터링하고 개인 식별 데이터를 추출해 보다 빠르고 효율적이고 빠르게 유출자를 찾아내는 시스템으로 업그레이드할 예정이다.
두 번째는 개인 식별을 위한 코드를 더욱 업그레이드해 코드 안에 더 많은 개인 식별 정보를 담을 수 있도록 할 계획이다. 어떤 정보를 추가로 담을지는 대외비라 여기서 언급할 수는 없지만, 불법 업로더를 발본색원하는데 많은 도움이 될 것으로 기대하고 있다. 과거 사람이 코드를 읽어낼 때에는 업무 강도 증가 때문에 쉽사리할 수 없는 업그레이드였으나, 인공지능이 이를 대신해주면 아무런 부담 없이 진행할 수 있다.
마지막으로 서 개발자는 툰레이더 AI 개발을 위해 많은 도움을 준 동료들에게 감사를 표했다. “인공지능을 개발하기 위해 4명의 네이버웹툰 개발자와 5명의 네이버 개발자들이 각고의 노력을 기울였다”며, “툰레이더의 미래가 확실치도 않음에도 불구하고 전폭적으로 믿고 지원해준 김준구 네이버웹툰 대표, 박찬규 네이버웹툰 최고개발자 등 동료 개발자들에게 고마울 따름”이라고 말했다.
글 / IT동아 강일용(zero@itdonga.com)