인공지능과 빅데이터, 패션에 사용할 수는 없을까?
[IT동아 권명관 기자] 인공지능. 그리고 빅데이터. 사전적 의미를 찾아보자. 초록창에서 인공지능을 검색했다. ‘인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술(출처: 네이버 지식백과 중 두산백과)’. 어렵다. 일단, 다음. 빅데이터를 알아보자.
빅데이터. ‘빅데이터는 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형 데이터들을 의미한다(출처: 국립중앙과학관)’. 무슨 뜬 구름 잡는 소리인가 할 테다.
이렇게 생각하자. 데이터란 정보다. 빅데이터는 많은 정보다. 얼마나 많은 것인가라는 기준은 없지만, 사람이 다루기 힘들 정보량이라고 이해하자. 인공지능은 많은 정보를 분류하는 기술이다. 조악한 비유지만, 사람이 다루기 힘들 정보를 분류한다. 그것도 아주 빠르게.
인공지능과 빅데이터의 관계
지난 2016년 3월 12일, 이세돌 9단과 알파고가 3번째 대국을 이어갔다. 결과는 알파고의 불계승. 이날 결과에 따라 이세돌과 알파고, 사람과 인공지능의 바둑 대국은 0:3이라는 스코어를 기록하면서 나머지 대국 결과와 상관없이 알파고가 승리했다. 대국 전 ‘바둑만큼은 사람이 이긴다’라고 자신했지만 말이다. 그리고 경악했다. ‘알파고가, 인공지능이 사람보다 창의적인 수를 둬서 이겼다’라고 생각했기 때문이다.
하지만, 이는 오해다. 알파고는 확률를 따졌다. 다음 수를 뒀을 때 이길 수 있는, 높은 확률을 연산해서 착수했다. 그 한 수를 사람들이 미처 예상하지 못했기에 ‘창의적인 수’라고 생각했을 뿐이다. 알파고(인공지능)는 어디까지나 확률를 분석해 연산한 최적의 수를 찾았다. 확률 분석을 위한 수많은 정보를 바탕으로.
즉, 인공지능을 활용한다는 의미는 빅데이터를 활용한다는 뜻이다. 그래서 빅데이터를 분석한다고 말한다. ‘구글 포토’ 서비스를 보자. ‘동물’이라고 입력하면, 알아서 동물 사진만 인식해 불러온다. 이는 ‘동물’, ‘음식’ 등 수백만 개 보기를 가지고, 구글 포토가 그 중 하나를 고르기 때문이다.
패션 산업에 활용할 수는 없을까?
코로나19는 많은 것을 변화시켰다. 학생과 직장인은 집에서 공부하고, 일한다. 사람들이 밖을 나가지 못한다. 소비는 온라인으로, 외식은 배달로 해결한다. 사회 전반적인 변화. 패션 산업계도 직격탄을 맞았다.
가까운 동대문을 보자. 서울의 동대문은 대한민국 패션의 중심지다. 하루 날잡고 밤새 쇼핑하며 옷을 담은 커다란 비닐을 들고 돌아다니는 젊은 사람을 흔히 발견할 수 있었다. 요 근래 몇 년간은 중국 관광객을 중심으로 전세계에서 몰린 쇼핑 인파가 동대문, 명동 일대를 누볐다. 하지만, 코로나19 이후 관광객은 물론 소비자가 찾지 않는다. 소비자가 오프라인으로, 밖으로 나오지 않는다. 어찌해야 할까.
해결 방법은 간단하다. 우리 옆에 있다. 온라인 쇼핑이다. 매월 통계청이 발표하는 ‘온라인 쇼핑동향’ 자료에 따르면, 국내 온라인 쇼핑 거래액은 총 12조 7,576억 원 규모다(2019년 11월 기준). 이중 의복, 의류가 차지하는 비중은 13.5%로 1조 7,179억 원에 달한다. 현재 온라인 쇼핑 규모다. 다만, 동대문을 비롯한 소상공인의 경우, 자체적으로 온라인 쇼핑을 운영하는데 현실적으로 어렵다. 오프라인 의류 매장 운영과 온라인 의류 쇼핑몰 운영은 준비해야 할 것도, 운영 방법도 다르다.
패션 산업을 위한 빅데이터 구축
코로나19로 직접적인 타격을 받은 패션 업계 소상공인을 위해 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 '인공지능(AI) 학습용 데이터 구축(2차)' 사업을 지원한다. 이는 한국전자통신연구원(ETRI)이 주관하는 컨소시엄 사업으로 인플루언서와 함께 패션 B2B2C 플랫폼을 선보인 스타트업 ‘트랜쇼’와 인공지능(AI) 데이터 전문 기업 ‘엠티콤’이 참여했다.
본 사업의 목표는 온라인 의류 쇼핑몰 운영에 필요한 의상 모델컷을 스튜디오 임대비나, 모델비를 들이지 않고 생성할 수 있도록 하는데 있다. 지금까지 쇼핑몰, 인스타그램 등 온라인에서 의류를 판매하는 사업자는 스튜디오에 모델을 불러 착용컷을 촬영한 뒤, 판매용 사진을 게재했다. 소상공인 쉽게 온라인 쇼핑에 도전하기 어려운 이유다. 돈이 필요하다. 스튜디오를 임대하고, 모델을 섭외해야 하며, 촬영하기 위한 영상 장비를 구비해야 한다.
만약 이를 저렴한 비용으로 쉽게 해결할 수 있다면? 스튜디오를 빌리지 않아도, 모델들이 옷을 직접 입지 않아도, 다양한 포즈를 취하지 않아도 말이다. 쉽게 말해 본 사업은 동대문 소상공인이 평상에 놓은 반팔티를 촬영하면, 모델이 입고 다양한 포즈를 취한 듯 어색하지 않은 사진으로 연출할 수 있도록 구현하는데 있다.
문제는 데이터다. 수많은 의류 사진이 필요하다. 100장, 1,000장, 1만장, 10만장을 촬영해 데이터를 구축하고(빅데이터), 이를 분석해 자연스럽게 모델이 입은 듯 구현할 수 있는 기술(인공지능)이 필요하다.
400만 장의 의류 데이터를 확보
트랜쇼는 지난 2020년 11월부터 본 사업에 참여, 400만 장을 목표로 총 600만 장의 사진을 촬영했다. 모델부터 섭외했다. 남녀 성별 구분부터 10대, 20대, 30대, 40대 등 연령층을 세분화했다. 이어서 상의, 하의, 모자, 신발 등 의류를 나눴고, 반팔티, 크롭티, 반바지, 청바지, 면바지, 자켓, 아우터, 패팅 점퍼 등 수많은 의류를 분류했다.
먼저 의류 사진을 앞뒤로 한 장씩 찍고, 해당 옷을 연령별 모델이 입고 다양한 포즈를 취한 후 촬영했다(빅데이터). 각 옷에 매핑되는 정보를 점으로 맞춰 포즈에 따라 어떻게 변화하는지를 파악하기 위함이다(인공지능). 빅데이터에 해당하는 원시 데이터를 트랜쇼가 제공하면, 인공지능 분석은 엠디콤이 담당했다.
이번 사업을 통해 생산한 데이터와 인공지능 기술은 공공데이터로 활용한다. 패션 업계 소상공인을 위해 데이터와 기술을 제공은 1차적이다. 이외에 다양한 산업, 업계에서 필요로 한다면 공공데이터로 활용해 이용할 수 있다. 궁극적으로 빅데이터, 인공지능 사업 인프라를 확보, 일자리를 창출하는 효과도 있다.
공공데이터로 직접 데이터를 구축하고, 인공지능 학습을 통해 인프라를 구축하면 저작권에서도 자유롭다. 모델, 의류 등에 대한 저작권 법적 문제를 해결해 제공한다. 해외 관광객이 끊긴 국내 패션 소상공인 업계에 활력을 넣고, 지속적으로 다품종 소량화를 통해 경쟁력을 강화하는데 도움을 준다. 소상공인의 자금 부담을 덜어주는 것은 두 말하면 입 아프다.
트랜쇼 정임수 기획본부장은 “유럽, 북미 등의 대형 온라인 쇼핑몰에서 구비한 비슷한 원천 데이터를 파악한 결과 약 50만 장으로 분석했다. 해당 데이터는 비공개로, 비싼 저작권료를 주고 사용해야 한다. 하지만, 이번에 참여한 사업을 통해 400만 장 이상의 원천 데이터를 확보했다”라며, “원천 데이터 촬영 작업은 끝났다. 이제 자세 분석, 영역 검출 인공지능 기술, 패션상품 신규 디자인 자동 생성 기술, 패션 상품 검색 기술 등 다양한 인공지능 학습용 데이터로 활용할 수 있기를 기대한다”라고 말했다.
글 / IT동아 권명관(tornadosn@itdonga.com)