[생성 AI 길라잡이] 스타일 유지하는 이미지 생성형 AI '플라멜'
※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.
[IT동아 남시현 기자] 이미지 생성형 AI는 이제 일상 가까이서도 활용할 수 있습니다. 마이크로소프트는 코파일럿 기능을 사용해 윈도우 11 PC에서 곧바로 생성형 AI로 이미지를 만들 수 있도록 지원하고, 뤼튼이나 캔바, 어도비 파이어플라이까지 다양한 무료 이미지 생성형 AI 서비스가 경쟁하고 있습니다. 하지만 기존 이미지 생성 AI의 가장 큰 단점은 통일감 있게 이미지를 만들거나, 특정 스타일을 유지해서 만들기가 어렵다는 점입니다.
예를 들어 이미지 생성형 AI로 동화책의 일러스트를 만든다고 하면, 처음에 만든 캐릭터나 그림을 유지하면서 여러 장의 이미지를 연달아 만들기가 어렵습니다. 그림의 배경 느낌이 조금씩 다른 식이죠. 스모어톡의 생성형 AI 서비스 ‘플라멜’은 이런 기존 생성형 AI의 단점을 넘어서 스타일을 유지하고, 이미지를 입력해 직접 스타일을 만들 수 있는 서비스입니다. 하루에 기본적으로 다섯 번, 20장의 무료 이미지를 만들 수 있습니다.
스타일 유지하는 이미지 생성 AI, 3D나 실사, 일러스트 등 응용
플라멜은 네이버 포털 검색으로 홈페이지에 진입할 수 있고, 서비스는 웹브라우저 상에서 제공됩니다. 따라서 컴퓨터로 진행하는 게 좋습니다. 기본적으로 선택할 수 있는 이미지 생성 방식은 텍스트만 입력하기, 이미지 첨부하기 두 종류입니다. 프롬프트를 직접 입력해서 결과물을 만들거나, 원하는 스타일의 이미지를 첨부해 프롬프트를 만든 뒤에 내용을 수정해서 이미지 생성 명령을 내리는 거죠.
플라멜의 핵심인 스타일 유지는 ‘텍스트만 입력하기’의 왼쪽 아래에 있는 ‘스타일’ 기능에 있습니다. ‘스타일 없음’을 클릭하면 입력하는 문구에 따라 스타일이 정해지고, 선택하는 기능으로는 사진, 벡터, 일러스트, 디지털아트, 회화, 오브젝트, 컨셉아트 등이 있습니다. 플라멜 추천으로 진입하면 2D 아이콘 및 3D 아이콘, 글리터리, 피치 퍼지 네 가지 선택지가 있습니다. 이 중에서 3D 아이콘을 선택하고 이미지를 만들어봅시다.
3D 이미지는 원래 포토샵 등의 전문 소프트웨어로 만듭니다. 하지만 플라멜에 저장된 탬플릿을 활용하면 지시 내린 형태의 3D 이미지를 만들 수 있죠. 우선 스타일에서 ‘플라멜 추천’을 누르고, ‘3D ICON’을 누릅니다. 그러면 이제 텍스트로 원하는 그림을 묘사하고 생성 버튼을 누르면 됩니다. 자영업자가 3D 이미지로 메뉴를 만든다 생각하고 지시를 내려봅니다.
프롬프트에 ‘라면’만 입력했습니다. 이때 단순히 3D 아이콘에 ‘라면’이라고만 치면 이미지가 제대로 만들어지지 않습니다. 따라서 ‘하얀 배경, 하얀 사기 그릇에 나무로 된 젓가락이 있음, 라면 위에 토핑이 얹어져 있고, 연기가 나는 모습’처럼 구체적이고 정확하게 지시를 내립니다. 2D 이미지나 3D 이미지, 혹은 다른 스타일을 입력해도 되고, 템플릿 중에서 비슷한 스타일을 골라도 됩니다. 완성된 이미지는 프롬프트를 입력하지 않은 것에 비해 훨씬 결과물이 구체적이며, ‘젓가락을 가지런히’ 라든가 ‘계란 프라이 추가’ 같은 명령도 내릴 수 있습니다.
완성된 이미지는 추가로 편집하거나 세부 사항을 바꿀 수 있습니다. 이미지를 선택하고서 ‘편집하기’를 클릭하면 배경 지우기, 디테일 살리기, 부분 수정하기, 부분 지우기 등의 기능이 있습니다. 배경 지우기는 문서나 편집 작업이 편리하도록 배경을 지운 모습이고, 디테일 살리기는 이미지의 세세한 부분의 해상력과 품질을 높입니다. 또 마음에 들지 않는 부분은 부분 지우기로 지울 수 있고, 부분 수정하기를 누른 후 추가로 프롬프트를 입력하면 원하는 모양이나 피사체로 바꿀 수 있습니다.
이미지를 생성할 때는 1:1, 4:3, 3:4, 16:9, 9:16 비율을 사전 지정하고, 완성된 이미지는 부분 편집하거나 배경을 제거하거나, 크기를 고르고 다운로드할 수 있습니다. 스타일 지정이 특별해 보이진 않으나, 이 3D 아이콘을 다른 형태로 만들 때 진가를 발휘합니다. 가령 다른 서비스로 라면을 만든 뒤, 짜장면, 만두, 볶음밥을 만들면 각자의 이미지에 통일성이 없습니다. 반면 플라멜의 결과물은 프롬프트만 유지하면 통일성 있게 이미지가 만들어집니다. 사람이나 캐릭터처럼 정체성이 확실한 피사체를 계속 유지하는 건 안되지만, 그렇지 않은 일반적인 피사체는 스타일대로 재생성할 수 있습니다.
이 기능을 활용하면 ‘스톡 이미지’에서 이미지를 찾을 필요가 없고, 또 디자이너에게 원하는 이미지를 제작 의뢰할 필요가 줄어듭니다. 다만 무료 이미지는 512x384의 작은 이미지에서만 워터마크가 제외되고, 1024x768의 HD급 이미지는 ‘Flamel’ 워터마크가 붙습니다. 2048x1536의 대형 이미지는 베이직 구독자에게만 제공됩니다. 아울러 디테일 살리기, 부분 수정, 부분 지우기 등도 워터마크가 붙습니다.
이미지 스타일 복사해 새 이미지로 구성할 수 있어
모델 학습 과정을 거치지 않고, 이미지 한 장만 입력하면 해당 이미지와 같은 스타일로 이미지를 구성할 수 있는 것도 플라멜의 특징입니다. 예를 들어 특정한 작가의 그림이 있고, 이 그림의 스타일을 유지하며 내가 상상하는 대로 다른 형태의 그림이나 모습을 만들고 싶다면 말이죠. 기존 생성형 AI로 이를 재구성하려면 별도의 모델 생성이 필요하지만, 플라멜은 이미지만 있다면 그 모습과 유사하게 새 형태의 이미지로 만들 수 있습니다.
이미지 첨부하기를 누르고 스타일 기반 이미지를 선택합니다. 이미지를 고르면 자동으로 프롬프트를 생성하거나, 직접 입력해도 됩니다. 이때 자동으로 생성하기를 누르고, 생성된 프롬프트를 기반으로 세부 내역을 직접 수정하는 것을 추천드립니다. 또 원하는 이미지 구성은 생성된 프롬프트에서 직접 내용을 추가해야 합니다.
처음 ‘빌뇌브라가의 다리’ 그림으로 생성된 문구는 ‘강 위에 놓인 돌 다리가 있는 그림. 다리는 양쪽에 금속 난간이 있으며 오래되고 낡은 느낌이다. 아래 강은 잔잔하고 여러 작은 보트가 떠 있다. 오른쪽에는 집과 나무가 있는 작은 마을이 있다. 푸른 하늘과 흰 구름, 현실적인 스타일로 그려진 그림, 평화롭고 고요한 분위기’입니다.
이를 원하는 이미지로 바꾸기 위해 ‘호수가 드리운 공원이며, 뒤에 만년설이 쌓인 산이 있습니다. 그 앞에 있는 벤치는 오래되고 닳아 있으며 약간의 녹과 벗겨진 페인트가 있습니다. 호수에는 잔잔하고 물 위에 보트가 한 대 떠 있습니다. 이미지 오른쪽에는 집과 나무가 있는 작은 마을이 있습니다. 하늘은 푸르고 흰 구름이 떠 있습니다. 사실적인 스타일로 그려졌고, 붓 자국이 남은 느슨한 붓터치와 생동감 있는 색깔을 사용했습니다. 유화 느낌이 있습니다. 전반적인 분위기는 평화롭고 고요’ 식으로 세세하게 바꿨고, 결과를 받았습니다.
그림뿐만 아니라 사진으로도 가능합니다. 사전에 플라멜에서 제공되는 이미지 스타일을 선택했으며, 이때 프롬프트는 ‘긴 웨이브 머리를 가진 젊은 여성이 의자에 앉아 다리를 꼬고 팔은 무릎 위에 뒀습니다. 그녀는 슬리브리스 블랙 탱크탑 원피스를 입고 진지한 표정으로 카메라를 바라보고 있습니다. 배경은 그림자가 드리워진 흰색 벽이며, 부드럽고 자연스러운 조명이 몽환적이고 천상의 분위기를 만들어냅니다. 전체적인 분위기는 침울하고 사색적’입니다.
이를 활용해 ‘짧은 웨이브 머리를 가진 젊은 여성이 의자에 앉아 다리를 꼬고 팔은 무릎 위에 뒀습니다. 그녀는 하늘색 원피스를 입고 진지한 표정으로 카메라를 바라보고 있습니다. 배경은 도서관이며, 부드럽고 자연스러운 조명이 몽환적이고 천상의 분위기를 만들어냅니다. 전체적인 분위기는 침울하고 사색적’으로 문구를 하나하나 바꾼 뒤 생성했습니다.
그 결과 전혀 다른 형태의 이미지가 등장했지만, 처음 이미지의 분위기는 여전히 남아있는 결과가 만들어졌습니다. 이때 피부 톤이나 옷 색, 자세, 조명, 분위기 등도 하나하나 설정하는 식으로 원하는 이미지를 만들 수 있습니다. 또 사람뿐만 아니라 풍경, 인테리어, 일러스트레이트, 드로잉, 스케치 등 원하는 형태는 어떤 것이든 만들 수 있습니다.
생성형 AI에서 문제가 되는 부분, 저작권은 어떨까요? 플라멜에서 기본 제공되는 이미지나 스타일은 저작권 문제가 없습니다. 따라서 이를 기반으로 생성형 AI를 돌려 만든 이미지는 상업적으로 이용해도 무방합니다. 다만 이미지 파일을 직접 업로드해 스타일을 생성하는 경우는 다릅니다. 누가 보더라도 명백하고 고유한 스타일을 원작자의 허가 없이 가져온 뒤, 이를 기반으로 만든다면 문제가 됩니다. 법적 해석의 여지는 있지만, 스타일을 가져올 때는 저작권자의 허가가 있거나 누구나 쓸 수 있는 이미지를 활용하는 것을 추천드립니다.
글 / IT동아 남시현 (sh@itdonga.com)