[생성 AI 길라잡이] 음성과 이미지만 있으면 영상을 만든다 ‘런웨이ML’
※ 생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.
[IT동아 강형석 기자] 지난 2024년 3월 13일(미국 현지 기준), 오픈AI는 동영상 생성 인공지능 ‘소라(SORA)’를 공개해 업계에 충격을 줬습니다. 인공지능이 만든 다양한 영상도 함께 공개됐죠. 오픈AI 측은 올해 내에 이용 가능할 것이라는 점을 강조하고, 시장에 혼란을 주지 않도록 충분한 안전 테스트를 진행한 후 일반에게 공개할 예정입니다. 딥페이크 같은 문제가 있어서는 안 될 일이니까요.
이와 동시에 소라 정도는 아니지만, 인공지능 동영상 생성 서비스는 제공되고 있습니다. 지금 소개할 런웨이ML(RunwayML)도 그 중 하나라 할 수 있습니다. 소라처럼 명령어 입력에 따라 동영상을 생성하는 수준은 아니지만, 이미지ㆍ명령어ㆍ그림도구(드로잉툴) 등을 활용해 멋진 영상을 만들어줍니다.
런웨이는 PC 웹 브라우저를 통해 사용 가능합니다. 다만 모바일은 안드로이드를 지원하지 않으며 애플 앱스토어에 ‘RunwayML’이라는 이름으로 내려받을 수 있는 상태였습니다. 아이폰, 아이패드 모두 같은 이름으로 검색이 가능합니다.
런웨이ML은 다양한 기능을 제공합니다. 영상 편집 외에 텍스트와 이미지를 활용해 영상을 생성해 주기도 합니다. 립싱크 비디오라는 기능이 참신한데 음성 파일을 등록하면 그에 맞춰 사람이 말하는 영상을 만들어줍니다. 이미지 합성, 인페인팅, 3D 효과, 해상도 향상도 지원합니다. 물론 모든 기능을 100% 자유롭게 쓸 수 없습니다. 대부분 생성형 인공지능 서비스와 마찬가지로 정해진 크레딧만큼 무료 사용이 가능하고 소진되면 이후 유료 결제를 해야 됩니다. 이 서비스는 가입하면 125 크레딧 정보가 기본 제공됩니다. 영상 기준으로 약 3개의 비디오 프로젝트를 다룰 수 있으며 텍스트로 최대 16초 가량 영상 생성이 가능합니다.
다양한 기능은 차후 다뤄보겠습니다. 먼저 확인해 볼 부분은 2세대(Gen-2)라 부르는 텍스트/이미지 영상 생성 기능입니다. 주 화면 상단에 있는 ‘Try Gen-2’를 클릭하거나 좌측 메뉴에 있는 ‘비디오 생성(Generate Videos)’을 클릭한 후 상단의 ‘Try Gen-2’를 클릭하거나 하단의 ‘텍스트/이미지에서 비디오로(Text/image to Video)’를 클릭하면 이동할 수 있습니다. 1세대(Gen-1)은 영상이 필요합니다. 영상 등록 후 텍스트를 입력하거나 도구를 활용해 원하는 형태로 영상을 변환합니다. 어떻게 보면 Gen-2가 텍스트로 영상을 생성하는 생성형 서비스라고 보는 게 좋겠습니다.
Gen-2의 핵심인 텍스트/이미지 영상 생성 메뉴로 들어가면 매우 단순한 화면 구성이 출력됩니다. 크게 보면 3분할 구조인데요. 가장 좌측에 있는 메뉴는 상세 설정과 브러시, 스타일, 화면비 등을 설정할 수 있습니다. 영상을 생성한 후 세부 작업을 진행할 때 씁니다.
화면 좌측에는 이미지를 끌어넣거나 텍스트를 입력하는 창이 있습니다. 지정된 영역에 이미지를 넣거나 명령어를 입력하면 인공지능이 영상을 생성합니다. 이미지는 보유한 파일을 넣으면 되고, 텍스트는 영문 기준 320자까지 입력할 수 있습니다. 화면 우측은 영상 처리 과정과 결과물을 보여줍니다.
명령어를 입력해 봤습니다. 절벽을 드론으로 찍은 모습을 만들어 달라고 요구했습니다. 입력을 마치니 약 3분 정도의 시간이 흐른 뒤 4초짜리 짧은 영상을 제안했습니다. 정말 입력한 대로 드론이 절벽 상공을 촬영한 듯한 영상이 출력됩니다. 영상은 기본 4초짜리를 만들어냅니다. 그리고 원하면 4초씩 연장해 생성할 수 있습니다. 물론 무료는 앞서 설명했던 105초라는 시간에서 차감됩니다. 유료 서비스라면 더 긴 영상을 만들 수 있겠습니다.
4초짜리 영상이 마음에 든다면 이제 저장해야 됩니다. 영상 우측 상단에 4개의 아이콘이 있습니다. 좌측부터 좋아요(하트), 저장하기, 콘텐츠 제출하기, 전체화면 재생하기 순입니다. 두 번째 아이콘인 다운로드를 클릭하면 브라우저 기본 저장 폴더에 영상이 기록됩니다. 생성된 영상은 약 8MB 정도였고 해상도는 720p(1280 x 720)보다 조금 큰 1408 x 768 픽셀이었습니다.
영상 상세 설정 내에서 해상도를 2K(2560 x 1440)로 높일 수 있습니다. 하지만 비용이 추가되므로 신중히 접근해야 되겠습니다. 무료 사용자판은 영상에 워터마크가 생성됩니다. 유료 사용자는 이를 없앨 수 있습니다. 영상은 상업 및 비상업용으로 사용이 가능하다고 합니다. 하지만 아직도 인공지능 생성 영상 사용에 대한 논란이 있으니 주의가 필요합니다.
이번에는 이미지를 가지고 영상 생성을 시도했습니다. 과거에 촬영했던 런던 타워브리지 사진을 중심으로 종이비행기가 새처럼 날아다니는 영상을 만들어달라고 요청했습니다. 역시 약 3분 정도의 시간이 지난 후 영상을 제안합니다. 종이비행기가 정말 새처럼 날개를 펄럭이며 날아다닙니다. 종이비행기 수가 많기를 원했는데 아쉽네요. 명령어에 더 많은 비행기를 넣으라고 넣을 걸 그랬습니다. 우선 이 영상도 저장했는데 흥미롭게도 3.4MB에 불과합니다. 영상 수준과 화질 등에 따라 용량 변화가 있으니 참고하세요.
런웨이ML은 이미지와 텍스트만으로 쉽게 영상을 생성하고 변환할 수 있는 생성형 인공지능 서비스입니다. 장시간 영상이 아는 초 단위의 짧은 영상 위주로 생성 가능하지만, 이 부분은 점차 늘어나리라 예상됩니다. 한글 인식은 아직 어렵지만, 간단한 영어 문장으로 영상 생성을 할 수 있습니다. 인공지능 영상 생성 혹은 변환하는 구조가 궁금하다면 한 번 도전해 보는 것은 어떨까요?
글 / IT동아 강형석 (redbk@itdonga.com)