구글의 AI 이미지 혁신, '나노 바나나' 이모저모

김영우 pengo@itdonga.com

[IT동아 김영우 기자] 최근 한 달간 AI 관련 커뮤니티나 SNS를 가장 뜨겁게 달군 키워드는 단연 '나노 바나나(nano-banana)'다. 나노 바나나는 이미지 생성용 AI 모델의 일종으로, 각종 AI 모델을 비교 및 평가하는 플랫폼인 'LMArena'에 지난 8월 중순 등록되어 처음 모습을 드러냈다.

구글 나노 바나나 이미지 / 출처=제미나이로 생성
구글 나노 바나나 이미지 / 출처=제미나이로 생성

당시의 나노 바나나는 아직 상용화 전이었고, 제작자가 누구인지도 알 수 없었다. 그럼에도 불구하고 압도적인 성능을 발휘하며 공개되자마자 큰 화제를 모았다. 워낙 똑똑한데다 결과물의 품질도 뛰어났기 때문이다. "이제 포토샵과 같은 기존의 이미지 편집 도구는 필요 없어질 것"이라고 예측하는 사람도 있을 정도였다.

이런 나노 바나나의 정체는 지난 8월 26일 밝혀졌다. 이날 구글은 자사 블로그를 통해 나노 바나나가 자신들이 개발한 것이며, 정식 명칭은 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’라고 발표했다. 그리고 발표와 동시에 기존 제미나이 2.5 플래시 AI 모델에 통합되는 형식으로 정식 출시되었다. 다만, 아직도 많은 사람들 사이에서는 '나노 바나나'라는 이름으로 통하며, 제작사인 구글 역시 이 별명을 공식적으로 사용하고 있다.

나노 바나나를 체험하는 방법

정식 출시된 나노 바나나를 체험하는 대표적인 방법은 두 가지다. 나노 바나나 기반의 서비스를 개발하고자 하는 전문가라면 구글의 웹 기반 개발자 도구인 '구글 AI 스튜디오(Google AI Studio)'에 접속하자. 여기서는 간단한 성능 테스트부터, 서비스나 앱 개발에 필요한 코드생성에 이르기까지의 다양한 작업을 프롬프트 입력만으로 간단히 처리할 수 있다. 무료 사용 한도는 요청 수 기준으로 매일 250회까지라 넉넉한 편이다.

구글 AI 스튜디오를 이용해 나노 바나나 기반의 앱과 서비스를 간단히 개발 가능 / 출처=IT동아
구글 AI 스튜디오를 이용해 나노 바나나 기반의 앱과 서비스를 간단히 개발 가능 / 출처=IT동아

이를테면 구글 AI 스튜디오의 'Build' 탭에 '나노 바나나 기반의 웹툰 제작 서비스를 생성해줘'라고 입력하는 것만으로도 불과 수십 초 만에 웹툰 제작 서비스의 프로토타입(시제품)이 완성된다. 프로그래밍 언어를 모르는 사람이라도 상관없으며, 이를 통해 웹이나 앱 서비스의 정식 출시 전에 미리 각종 기능 테스트를 할 수 있다.

전문가가 아닌 일반인이라면 구글 제미나이 앱이나 웹 서비스를 이용하는 것이 나노 바나나의 성능을 체험할 수 있는 가장 간단한 방법이다. 구글 제미나이 서비스를 실행한 후, 모델 선택 메뉴에서 ‘2.5 Flash’로 설정하는 것 만으로 곧장 나노 바나나를 이용할 수 있는 준비가 끝난다. 제미나이 앱을 통해 사진을 업로드하거나 자세한 상황 설명을 하는 것 만으로 손쉽게 이미지 편집 및 생성이 가능하다.

제미나이 웹이나 앱 서비스의 ‘2.5 Flash’ 모델을 선택해 나노 바나나 기능을 이용할 수 있다 / 출처=IT동아
제미나이 웹이나 앱 서비스의 ‘2.5 Flash’ 모델을 선택해 나노 바나나 기능을 이용할 수 있다 / 출처=IT동아

무료 사용자라도 별도의 이용 횟수 제한은 없기 때문에 자유롭게 이미지를 편집하거나 생성할 수 있다. 다만 개인 사용자라고 하기에는 작업량이 과도한 수준(하루 5만 건의 요청, 분당 2000건의 요청, 분당 150만 토큰 초과)이라면 유료 요금제 전환이 필요하다고 구글은 밝혔다.

기존 AI와 확연히 다른 나노 바나나의 특징

나노 바나나를 실제로 이용하며 가장 처음 느낀 장점은 이미지 생성 속도가 빠르다는 점이다. 어지간한 결과물은 10초에서 30초 사이에 출력되며, 아주 간단한 편집 작업의 경우 1~2초 만에도 결과를 확인할 수 있었다.

원본 사진의 포즈나 표정을 바꾸는 정도의 작업은 10초 이내로 결과물을 확인할 수 있다 / 출처=IT동아
원본 사진의 포즈나 표정을 바꾸는 정도의 작업은 10초 이내로 결과물을 확인할 수 있다 / 출처=IT동아

해외 기업의 제품임에도 한국어를 아주 잘 이해하는 것도 인상적이었다. 기존의 해외 AI 이미지 생성 도구들의 경우, 제대로 쓰려면 영어로 명령을 하는 게 낫다는 ‘팁’도 있었다. 하지만 나노 바나나는 한국어 명령을 정확히 이해한다. 이를테면 "완전 힙한 스타일로 착장한 MZ세대 남녀가 카페에서 셀카를 찍는 장면" 같은 한국 온라인 커뮤니티에서만 통용되는 은어나 유행어까지 정확히 해석해 이미지에 반영한다. 이는 구글이 한국 시장을 겨냥해 별도의 한국어 데이터셋을 대규모로 학습시킨 결과로 분석된다.

기존 AI로 편집하는 경우, 원본 이미지의 그림체나 구도가 바뀌는 경우가 많았지만 나노 바나나는 원본과 매우 흡사한 스타일의 결과물을 생성할 수 있다 / 출처=IT동아
기존 AI로 편집하는 경우, 원본 이미지의 그림체나 구도가 바뀌는 경우가 많았지만 나노 바나나는 원본과 매우 흡사한 스타일의 결과물을 생성할 수 있다 / 출처=IT동아

나노 바나나가 기존 AI 이미지 도구들과 확연히 구별되는 점은 원본 이미지의 일관성을 유지하는 능력이다. 기존의 이미지 AI들은 간단한 편집 요청에도 원본의 전체적인 분위기나 스타일을 크게 변화시키는 경우가 많았다. 예를 들어 '원피스' 스타일의 캐릭터 이미지에서 단순히 표정만 바꿔달라고 요청했는데도 결과물은 '지브리' 스타일의 완전히 다른 그림체로 변해버리는 식이었다. 하지만 나노 바나나는 어떤 편집을 하더라도 원본의 본래 특성과 개성을 잃지 않는다.

기존 AI들이 자주 실수하던 부분들을 정확하게 처리한다는 점도 인상적이다. 가장 대표적인 예가 인체 구조의 묘사로, 기존 AI들이 사람의 손을 그릴 때 손가락 수가 틀리거나 관절 구조가 부자연스러운 경우가 빈번했지만, 나노 바나나는 손가락 다섯 개를 정확히 그려내며 각 관절의 위치와 굽힘도 자연스럽게 표현한다.

기존 AI는 ‘캐릭터가 국수를 먹는 장면’을 묘사하는 과정에서 각종 오류가 발생하곤 했지만 나노 바나나는 이런 문제를 해결했다 / 출처=IT동아
기존 AI는 ‘캐릭터가 국수를 먹는 장면’을 묘사하는 과정에서 각종 오류가 발생하곤 했지만 나노 바나나는 이런 문제를 해결했다 / 출처=IT동아

복잡한 상황 묘사에서도 확연한 차이를 보인다. '캐릭터가 국수를 먹는 장면'처럼 여러 요소가 복합적으로 상호작용하는 상황에서 기존 AI들은 젓가락의 위치가 어색하거나 국수가 공중에 떠있는 듯한 오류를 자주 만들어냈다. 반면 나노 바나나는 젓가락으로 국수를 집는 동작, 그릇과 음식의 물리적 관계, 캐릭터의 자연스러운 식사 자세까지 모두 현실적으로 구현한다.

나노 바나나는 이해도가 높은 편이라 ‘대충’ 명령해도 그럭저럭 쓸만한 결과물을 기대할 수 있다. 하지만 역시 최상의 결과물을 얻으려면 더 구체적이고 세부적인 묘사를 하는 것이 좋다. 이를테면 "사람"보다는 "20대 초반의 짧은 단발 머리에 둥근 안경을 쓴 여성"처럼 외모를 구체화하고, "요리하는 모습"보다는 "프라이팬을 들고 야채를 볶으며 미소 짓는 순간"으로 동작과 표정을 명시하는 것이 좋다. 이미지 편집 시에는 "표정만 더 밝게", "배경색만 파란색으로" 등 변경할 부분을 명확히 지정하면 나노 바나나의 뛰어난 일관성 유지 능력을 최대한 활용할 수 있다.

온라인을 뜨겁게 달군 피규어 이미지 열풍

나노 바나나의 뛰어난 성능은 출시 직후부터 온라인에서 뜨거운 반응을 불러일으켰다. 특히 각종 커뮤니티와 SNS에서는 나노 바나나로 생성한 캐릭터 피규어 이미지들이 연일 화제가 되고 있다. 기존 AI 도구로는 구현하기 어려웠던 정교한 피규어의 질감, 세밀한 디테일, 그리고 무엇보다 실제 제품처럼 보이는 현실감이 사용자들의 감탄을 자아내고 있는 것이다.

나노 바나나를 이용, 원본 이미지를 피규어의 모습으로 재생성한 모습 / 출처=IT동아
나노 바나나를 이용, 원본 이미지를 피규어의 모습으로 재생성한 모습 / 출처=IT동아

이런 현상이 가능한 이유는 나노 바나나의 뛰어난 일관성 유지 능력과 해부학적 정확성, 그리고 질감 표현 능력이 피규어 이미지 생성에 최적화되어 있기 때문이다. 사용자들은 애니메이션이나 게임 캐릭터를 입체적인 피규어 형태로 상상해서 구현하거나, 아예 존재하지 않는 한정판 피규어를 마치 실제 제품처럼 만들어내는 등 새로운 형태의 문화를 개척하고 있다.

이미지 제작의 새로운 패러다임

나노 바나나의 등장은 단순히 새로운 AI 도구가 하나 더 나온 것 이상의 의미를 갖는다. 속도와 품질, 접근성을 모두 갖춘 이 도구는 일반인들도 전문가 수준의 이미지 작업을 할 수 있게 해주었다. 특히 한국어를 잘 이해한다는 점은 국내 사용자들에게 큰 장점이 될 것으로 예상된다.

물론 아직 호불호가 갈릴 만한 부분들도 있다. 반드시 오류 없는 고품질의 결과물을 생성해야 한다는 압박감 때문인지 사전 데이터나 구체적인 설명이 부족한 경우에는 ‘이미지를 생성할 수 없다’는 메시지를 출력하는 경우도 가끔 있었다. 다소 엉뚱하더라도 어떻게든 결과물을 내놓던 기존 AI와는 다른 점이다.

그리고 저작권이나 윤리적 문제에 대한 지속적인 논의도 필요하다. 이 때문인지 구글은 투명성 확보를 위해 제미나이로 생성하거나 편집한 모든 이미지에 눈에 보이는 워터마크와 함께, 보이지 않는 신스ID(SynthID) 디지털 워터마크를 삽입해 AI 생성 이미지임을 명확히 표시한다고 밝혔다.

하지만 현재까지의 성능과 발전 속도를 고려할 때, 나노 바나나는 이미지 제작 분야의 ‘게임 체인저’가 될 가능성이 충분하다. AI 기술이 우리 일상에 더욱 깊숙이 스며들고 있는 지금, 나노 바나나 같은 도구들을 어떻게 현명하게 활용할지가 개인과 기업 모두에게 중요한 과제가 될 것이다.

IT동아 김영우 기자 (pengo@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.