북아이피스 "교육콘텐츠 출처 식별 기술로 저작권 문제 해결"
[IT동아 차주경 기자] 생성형 AI가 교재·문항·학습자료를 무한하게 만들어내는 시대다. 이 가운데 교육 산업계는 저작권 문제를 고민한다. ‘어떤 문항이 원본인지’, ‘AI가 어디서 학습했는지’, ‘이 자료를 사용해도 되는지’, ‘누가 얼마만큼 사용했는지’ 등을 조사해야 해서다. 이 문제를 에듀테크 기업 북아이피스(공동대표 윤미선·김관백)가 푼다. 이들은 한국저작권위원회가 추진한 ‘UCI 보급·확산 및 활용 모델 지원사업’을 3년간 수행하며 교육콘텐츠를 데이터 단위로 식별·분류·추적·정산하는 기술 체계를 구축했다.
북아이피스가 구축한 시스템은 단순한 파일 관리 기술이 아니다. 교육콘텐츠 하나하나에 국가표준 식별번호(UCI)를 부여하고, 그 안에 콘텐츠의 출처·유사도·학년·과목·난이도 등 교육과정 기반 정보를 붙인다. 여기에 AI 기반 분석 기술을 더해 콘텐츠의 관계망과 생성 여부, 원본과의 차이를 자동으로 판별할 수 있도록 했다.
특히 생성형 AI 콘텐츠 식별 기술이 눈에 띈다. 생성형 AI가 만든 문항이 기존 교재의 특정 지문이나 문제를 참고했는지, 혹은 학습 데이터로 사용되었는지 판단하는 기술이다. 북아이피스는 학습 데이터 멤버십 추론(Membership Inference), RAG 기반 출처 비교, Fuzzy Hashing 기반 유사도 검증 등 여러 AI 안전기술을 적용해 생성물의 ‘출처 흔적’을 추적한다. AI가 어디서 학습했고, 어떤 콘텐츠와 유사한지 기술적으로 밝혀내는 구조다.

이 기술은 교육콘텐츠 유통 시장에 큰 변화를 가져올 것으로 기대한다. 지금까지는 출판사·교사·에듀테크 기업이 각자 다른 방식으로 자료를 관리해왔지만, 북아이피스 모델이 적용되면 교과서·참고서·현장교사 문항·AI 생성물까지 모두 동일한 기준으로 식별된다. 해당 문항이 어디서 왔는지, 누구의 저작권인지, 어디에 어떻게 사용되었는지 자동으로 기록된다. 이 데이터는 그대로 정산에 반영돼 창작자와 출판사, 교육현장이 신뢰할 수 있는 구조를 갖게 된다.
실제로 사업 3년간 누적 168만 건의 문항에 UCI가 발급됐고, 월 64만 건 이상 거래가 발생했다. 누적 이용은 830만 건을 넘었다. AI 분석 기술이 실제 현장에서 작동하고 있다는 증거다. 과거에는 선생님들이 만든 자료가 시장에 남지 못하고 사장되거나, 저작권 분쟁 위험 때문에 유통이 어려웠다면 이제는 정식 저작권 체계 안에서 안전하게 거래되고 정산된다. AI 시대에 필요한 ‘기술 기반 저작권 질서’가 실제 시장에서 작동하기 시작한 셈이다.
북아이피스는 이 기술을 공교육에도 확산한다. 광주광역시교육청이 운영하는 AI-ON 플랫폼에 공급한 데 이어, 여러 교육청 및 공공기관과 협력을 논의 중이다. 선생님들이 만든 문항, 학교 자체 제작 콘텐츠, AI가 생성한 보조 자료까지 모두 UCI 기반으로 관리할 수 있는 구조를 도입하는 방식이다. 전국 단위로 표준화가 이뤄질 경우, 교육콘텐츠 관리 체계는 지금과 전혀 다른 형태로 재편될 가능성이 높다.
이와 함께 북아이피스는 ‘UCI 활용 교육콘텐츠 유통 가이드’를 발간해 교사·출판사·기관이 콘텐츠를 어떻게 등록하고, 어떤 기준으로 저작권을 관리하며, 어떤 방식으로 정산되는지 명확히 제시했다. 이 가이드는 AI 시대 교육콘텐츠 유통 정책 논의의 기반이 될 것으로 평가받는다.
김관백 북아이피스 공동대표는 “AI 시대의 교육 콘텐츠는 단순한 파일이 아니라 데이터 단위로 식별되고 추적돼야 한다. UCI와 AI 기술을 결합해 교육콘텐츠의 출처·저작권·정산 문제를 기술적으로 해결하는 표준을 만들겠다.”고 말했다.
IT동아 차주경 기자(racingcar@itdonga.com)

