[그때 그 IT] 웹크롤링 판례 (1) 사람인HR의 잡코리아 채용정보 무단복제 사건

김동진 kdj@itdonga.com

‘판례’란 법원이 특정 소송에서 법을 적용하고 해석해서 내린 판단입니다. 법원은 이 판례를 유사한 종류의 사건을 재판할 때 중요한 참고자료로 활용합니다. IT 분야는 기술의 발전 속도가 이를 뒷받침하는 제도의 속도보다 현저히 빠른 특성을 지녀 판례가 비교적 부족합니다. 법조인들이 IT 관련 송사를 까다로워하는 이유입니다. 하지만 디지털 전환을 거치며, IT 분야에도 참고할 만한 판례들이 속속 쌓이고 있습니다. IT동아는 법무법인 주원 홍석현 변호사와 함께 주목할 만한 IT 관련 사건과 분쟁 결과를 판례로 살펴보는 [그때 그 IT] 기고를 격주로 연재합니다.

출처=엔바토엘리먼츠
출처=엔바토엘리먼츠

‘잡코리아와 사람인HR 간 채용정보 무단복제 판례’로 본 공개정보 웹크롤링 위법 가능성 (서울고등법원2017. 4. 6. 선고 2016나2019365 판결 등)

“챗GPT는 그 많은 정보를 어디서 알게 된 것일까?”

지난 2022년 11월, 챗GPT가 공개되며 전 세계 사람들에게 신선한 충격을 안겼습니다. 챗GPT는 인공지능 연구소 ‘오픈에이아이(OpenAI)’가 개발한 대화형 인공지능 챗봇(chatbot) 서비스입니다. 대화창에 있는 챗봇에 질문하거나 요청사항을 말하면, 순식간에 원하는 답변 또는 결과물을 제공해 줍니다. 특정한 주제의 논문 작성이나 코딩을 해 달라는 복잡한 요청에도 반응하며, 제법 그럴듯한 결과물을 내놓기 때문에 산업의 패러다임을 바꿀 게임 체인저로 주목받고 있습니다.

챗GPT의 답변은 방대한 양의 학습 데이터를 기반으로 만들어집니다. 오픈AI가 발표한 자료에 따르면, 학습 데이터의 가장 큰 비중을 차지하는 것이 웹크롤링(Web Crawling)으로 수집한 데이터라고 합니다. 웹크롤링이란, 쉽게 말해 웹사이트에서 필요한 데이터를 자동으로 탐색하는 행위를 말합니다. 즉, 챗GPT가 학습하는 데이터의 대부분은 인터넷상에 존재하는 정보라고 할 수 있습니다.

오픈AI는 챗GPT의 학습데이터 출처를 구체적으로 밝히지 않았습니다. 이로 인해 뉴욕타임스와 같이 유료로 구독하는 일간지 기사도 웹크롤링해 무단으로 사용하는 것 아니냐는 논란도 존재합니다. 유료 콘텐츠를 의도적으로 저작권자의 동의 없이 학습데이터로 이용했는지에 대해서는 아직 명확하게 밝혀지지 않았고, 인터넷상에 넘쳐나는 불법 복제물들을 정확하게 필터링하고 있는지에 대한 의문도 여전히 존재합니다. 인공지능 학습을 위한 저작물 이용을 허용할 것인지, 허용한다면 그 범위는 어느 정도인지도 AI 시대에 중요하게 다뤄야 할 이슈 중 하나입니다.

그렇다면 공개된 데이터를 웹크롤링해 이용하는 것은 전혀 문제가 되지 않을까요? 접근권한이 있는 정보가 아닌, 웹사이트에 접속하는 사람이라면 누구나 볼 수 있는 정보이기 때문에 이용에 제한이 없다는 견해도 있을 수 있습니다.

그러나 사람인HR이 잡코리아 웹사이트에 있는 채용정보를 웹크롤링한 사건에서 우리 법원은 사람인HR이 저작권법상 데이터베이스 제작자의 권리를 침해했다고 판단했습니다. 이 판결로 공개된 정보라 하더라도 웹크롤링이 무제한으로 허용되는 것은 아님을 확인했습니다(서울고등법원 2016나2019365 등).

각사 로고. 출처=각사 제공
각사 로고. 출처=각사 제공

한 번쯤 이용해 본 경험이 있으리라 생각됩니다만, 잡코리아와 사람인HR은 모두 구인·구직 플랫폼을 운영하는 회사입니다. 사람인HR이 온라인 구인·구직 시장의 후발주자로 경쟁하는 과정에서 잡코리아 웹사이트에 게재된 채용정보를 웹크롤링해 무단으로 수집한 후 그대로 자신의 웹사이트에 올려 문제가 된 사안이었습니다.

2010년부터 시작된 양사 간 소송전은 두 차례 조정을 통해 사람인HR이 잡코리아에서 수집한 채용정보를 그대로 게재하지 않기로 합의하고 마무리되는 듯했습니다. 그러나 사람인HR 측에서 채용정보 복제행위를 계속해 잡코리아가 저작권 침해 금지 및 손해배상 등을 구하는 소를 제기하면서 이 사안은 법원의 판단을 받게 됐습니다.

사람인HR 측은 웹크롤링이 보편적인 IT기술이므로 인터넷 관련 업계에서 널리 통용되는 영업 수단이며, 잡코리아의 권리를 침해한 사실이 없다고 주장했습니다. 그러나 법원은 최종적으로 잡코리아의 웹사이트가 저작권법상 데이터베이스에 해당(저작권법 제2조 제19호)하며, 이를 제작하고 유지하는 데 상당한 투자를 한 잡코리아는 데이터베이스 제작자의 권리(저작권법 제93조)를 가지므로, 사람인HR의 무단 복제행위로 인해 잡코리아의 권리가 침해됐다고 판시했습니다(대법원 2017다224395).

사람인HR 주장과 달리, 공개된 정보에 대한 웹크롤링이 영업 수단으로 제한 없이 허용되는 것은 아니라는 것입니다. 웹사이트에서 누구나 확인할 수 있더라도 웹사이트 운영자가 상당한 시간과 노력을 들여 데이터베이스화한 정보를 특히나 경쟁업체에서 무단으로 수집·이용하는 행위는 허용되지 않는다는 취지로 풀이됩니다. 이후 잡코리아는 추가 확인된 채용정보 무단복제 건에 대해 사람인HR을 상대로 동일한 취지의 소송을 제기했고, 소송 진행 중 사람인HR이 잡코리아에 120억원의 합의금을 지급하고 홈페이지에 사과문을 공고하며 양사 간 채용정보 무단복제 분쟁은 막을 내렸습니다.

사람인HR은 향후에도 잡코리아에 게재된 채용정보를 수집 및 무단복제 할 수 없게 됐으며, 사람인HR이 잡코리아로부터 수집한 채용정보의 HTML 소스와 사용 중인 자동 게재 시스템을 모두 폐기해야 했습니다.

이같은 판결이 있었지만 웹크롤링에 대한 분쟁은 계속 이어지고 있습니다. 특히 4차 산업혁명이 가속화될수록 21세기 석유라고 불리는 데이터 ‘소유’와 ‘공유’에 대해 이해당사자들 간 첨예한 대립이 예상됩니다. 마침 챗GPT의 등장으로 이와 관련한 다양한 논의가 활발하게 진행되고 있습니다. 논의는 충분히 하되, 그 결과물이 시의적절하게 법과 제도에 반영될 수 있도록 입법적·정책적 노력도 뒷받침돼야 할 것입니다.

다음 기고에서는 5여년간의 법정 다툼 끝에 지난해 8월경 종결된 야놀자와 여기어때 간 데이터 크롤링 분쟁과 관련된 판례(서울고등법원 2022. 8. 25. 선고 2021나2034740 판결, 대법원 2022. 5. 12. 2021도1533 판결 등)를 소개해 드리도록 하겠습니다.

글 / 홍석현 법무법인 주원 변호사

홍석현 변호사는 서울대학교 법과대학 및 고려대학교 법학전문대학원을 졸업하고 제4회 변호사 시험에 합격했습니다. 김앤장 법률사무소 소속 변호사로 일하다가, 현재는 법무법인 주원 파트너 변호사로 재직 중입니다.

정리 / IT동아 김동진 (kdj@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.