[AI써봄] 챗GPT 이미지 2.0, 무료 플랜으로 어디까지 가능할까

※ 인공지능이 세상을 바꿉니다. IT동아 기자들이 만난 최신 인공지능 서비스와 기능을 독자들도 쉽게 접하도록 풀어서 알려드립니다.

[IT동아 박귀임 기자] AI 이미지 생성 모델은 초반 혁신적이라는 평가가 많았지만 몇 가지 문제가 반복됐다. 글자를 이미지 안에 정확히 그려 넣지 못하는 것이 대표적이었다. 한글 자모가 뒤엉키거나 전혀 다른 문자가 등장하는 사례도 비일비재했다. 프롬프트를 정교하게 입력하더라도 몇몇 조건을 놓치거나, 소재 질감을 사실적으로 표현하지 못하는 한계도 이어졌다.

오픈AI는 챗GPT 이미지 2.0을 선보였다 / 출처=오픈AI
오픈AI는 챗GPT 이미지 2.0을 선보였다 / 출처=오픈AI

글로벌 AI 기업 오픈AI(OpenAI)가 지난 4월 21일 공개한 '챗GPT 이미지 2.0(ChatGPT Images 2.0, gpt-image-2)'은 이러한 AI 이미지 생성 모델의 고질적 약점을 정면으로 겨냥했다.

오픈AI에 따르면 챗GPT 이미지 2.0은 세부 지시 이행 능력과 다국어 텍스트 표현 정확도를 크게 끌어올린 추론 기능 탑재 첫 이미지 모델이다. 오픈AI는 이 모델을 단순한 렌더링 툴이 아닌 '비주얼 사고 파트너(visual thought partner)'라고 부른다. 이미지를 그리기 전에 먼저 '생각'하는 AI라는 의미다.

앱 버전으로 챗GPT 이미지 2.0 이용하는 화면 / 출처=IT동아
앱 버전으로 챗GPT 이미지 2.0 이용하는 화면 / 출처=IT동아

챗GPT 이미지 2.0은 전작 챗GPT 이미지(ChatGPT Images)와 비교해도 변화의 폭이 상당하다. 그렇다면 이 변화가 비용을 지불하지 않는 무료 사용자에게도 유효할까. 챗GPT 이미지 2.0의 핵심이라고 할 수 있는 추론 기능은 플러스(Plus)·프로(Pro)·비즈니스(Business) 구독자 전용이다. 무료 플랜에서는 기본 이미지 생성만 가능하다. 개선된 텍스트 렌더링(이미지 속 글자 정확도)과 사진 사실성이 무료 환경에서도 실제로 체감되는지, 어떤 유형의 프롬프트에서 한계가 드러나는지를 직접 확인했다.

PC·앱 버전 같은 듯 다른 구성

기자는 무료 플랜으로 챗GPT 이미지 2.0를 이용해봤다. 챗GPT에 접속 후 6가지 프롬프트를 직접 입력했고, PC와 앱 버전 모두 경험했다.

PC 버전으로 챗GPT 이미지 2.0 이용하는 화면 / 출처=IT동아
PC 버전으로 챗GPT 이미지 2.0 이용하는 화면 / 출처=IT동아

프롬프트를 입력하면 PC 버전의 경우 ▲밑그림 그리는 중 ▲초안 만드는 중 ▲장면을 구성하는 중 ▲세부 묘사 다듬는 중 ▲마무리하는 중 ▲마지막 손질하는 중 ▲마지막으로 다듬는 중 등의 과정을 거쳐 이미지를 생성했다. 앱 버전은 ▲이미지 생성 중 이외에 별다른 변화 없이 결과물을 만들었다.

챗GPT 무료 플랜 내용 / 출처=IT동아
챗GPT 무료 플랜 내용 / 출처=IT동아

무료 플랜의 내용을 살펴 보면 '제한적 이미지 생성'이라고만 나올 뿐 그 기준이 명확하지 않다. 기자가 테스트한 결과 PC 버전은 8장, 앱 버전은 7장 이후 각각 제한이 걸렸다. 오픈AI가 한도 기준을 공식적으로 밝히지 않는 만큼, 서버 상황이나 시점에 따라 달라질 수 있다.

이미지 생성 한도 도달 시 화면 / 출처=IT동아
이미지 생성 한도 도달 시 화면 / 출처=IT동아

이미지 생성 한도 도달 시 '지금은 이미지 생성 도구를 호출할 수 없는 상태라 요청하신 장면을 바로 만들어드릴 수 없어요. 제한이 리셋되면 바로 이어서 생성할 수 있습니다'라고 안내 메시지가 떴다. 또 챗GPT 비즈니스로 업그레이드하거나 약 23시간 후 가능하다고 알려줄 때도 있었고, 2시간 후 다시 시도하라고 나올 때도 있었다. 초기화 시점 역시 오픈AI가 명시하지 않은 만큼 유동적이다.

이미지 속 한글: 가장 눈에 띄는 변화

AI 이미지 생성의 고질적 약점은 글자였다. '카페 메뉴판을 그려줘'라고 요청하면 읽을 수 없는 글자들이 나열되는 것이 일반적이었다. 챗GPT 이미지 2.0은 이 부분에서 명확한 도약을 보인다. 한국어가 포함된 인포그래픽 생성을 요청했을 때, 한글 자모가 뒤섞이는 현상 없이 온전한 문장으로 표현됐다.

오픈AI 공식 블로그에 따르면 다국어 문자 지원도 챗GPT 이미지 2.0에서 강화됐다. 한국어를 포함해 일본어, 중국어, 힌디어, 벵골어 등 비라틴 문자에 대한 텍스트 렌더링 성능을 크게 개선한 것. 오픈AI는 "단순히 라벨 몇 개를 번역하는 수준을 넘어 포스터·설명 자료·도식·만화 등에서 언어를 디자인의 일부로 반영해 시각적으로도 자연스럽게 어우러지는 결과물을 생성할 수 있다"고 설명했다.

브런치 카페 메뉴판 요청 결과물 / 출처=오픈AI 생성 이미지
브런치 카페 메뉴판 요청 결과물 / 출처=오픈AI 생성 이미지

우선 감성적인 브런치 카페의 메뉴판 이미지를 요청했다. 크래프트지 배경에 손글씨 스타일 폰트로 메뉴 이름(한국어)과 가격(원 단위)은 물론 에그베네딕트 1만8000원, 아보카도 토스트 1만6500원, 아메리카노 5500원이 포함된 레이아웃이라고 설명했다. 텍스트가 선명하게 읽혀야 한다는 내용도 추가로 적었다. 그 결과 추가 수정이 필요 없을 정도의 메뉴판을 생성했다. 다만 손글씨 스타일 폰트 표현은 실제 손글씨와는 다소 거리가 있었다.

교육용 인포그래픽 요청 결과물 / 출처=오픈AI 생성 이미지
교육용 인포그래픽 요청 결과물 / 출처=오픈AI 생성 이미지

다음은 한국어 교육용 인포그래픽을 만들었다. 물의 순환 과정을 설명하는 내용에 증발, 응결, 강수, 지표 유출 4단계를 화살표로 연결하고 각 단계 아래에 2줄 이내의 한국어 설명을 넣어 달라고 설명했다. 여기에 깔끔한 플랫 디자인, 파란색과 흰색 계열에 모든 한국어 텍스트가 정확하게 표시돼야 한다고 덧붙였다. 이 결과물 역시 오류 없이 모두 반영했다.

SNS 카드뉴스 요청 결과물 / 출처=오픈AI 생성 이미지
SNS 카드뉴스 요청 결과물 / 출처=오픈AI 생성 이미지

이외에 한영 혼용 타이포그래피를 반영한 SNS 카드뉴스도 생성했다. 프롬프트에는 '인스타그램용 1:1 비율 카드뉴스 이미지. 상단에 영문 헤드라인 "AI is changing everything", 중앙에 한국어 소제목 "우리가 준비해야 할 것들", 하단에 영문 출처 표기 "Tech Insight 2026"이 들어가는 레이아웃. 다크 네이비 배경, 흰색과 포인트 컬러(민트) 텍스트. 모든 글자가 선명하게 렌더링되어야 해'라고 작성했다. 배경부터 문구까지 프롬프트 요청에 맞춘 카드뉴스가 완성됐다.

사진 사실성: 조명·질감 자연스럽게 개선

소재 질감과 빛 처리는 AI 이미지 생성이 오랫동안 취약했던 영역이었다. 이 역시 챗GPT 이미지 2.0에서는 비교적 개선됐다고 느껴졌다.

제품 사진 요청 결과물 / 출처=오픈AI 생성 이미지
제품 사진 요청 결과물 / 출처=오픈AI 생성 이미지

먼저 소재 질감과 반사광을 확인하기 좋은 제품 사진을 요청했다. 제품은 무광 블랙 세라믹 머그컵이었다. 흰색 대리석 테이블 위에 올려져 있고, 왼쪽 45도 방향에서 자연광이 들어오는 설정으로 컵 표면의 미세한 질감과 대리석의 결이 사실적으로 표현되도록 설명했다. 여기에 배경은 아웃포커싱, 광고 촬영 수준의 퀄리티를 추가했다. 결과물을 확인해보니 소재 질감은 물론 반사광까지 자연스럽게 담겼다. 다만 대리석 결의 방향성은 다소 단조롭게 표현됐다.

음식 사진 요청 결과물 / 출처=오픈AI 생성 이미지
음식 사진 요청 결과물 / 출처=오픈AI 생성 이미지

음식 사진도 사실성을 보기 위해 만들었다. 프롬프트에 '갓 지은 흰쌀밥과 된장찌개가 놓인 한식 상차림 사진. 뚝배기에서 김이 살짝 오르는 장면. 나무 트레이 위, 위에서 약간 비스듬한 앵글(플랫레이 아님). 따뜻한 텅스텐 조명, 밥알의 윤기와 찌개 국물의 질감이 사실적으로 보여야 해. 음식 잡지 스타일'이라고 적었다. 결과물을 보고 수저를 나무가 아닌 금으로 바꾸는 것을 요청했다. PC 버전에서는 한가지만 보여줬지만, 앱 버전에서는 2가지 중 선택할 수 있도록 제안했다. 다만 큰 차이는 없어서 아쉬웠다.

실내 공간 사진 요청 결과물 / 출처=오픈AI 생성 이미지
실내 공간 사진 요청 결과물 / 출처=오픈AI 생성 이미지

마지막으로 자연광과 깊이감을 테스트하기 위해 실내 공간 사진을 요청했다. 프롬프트에 '오후 3시 햇살이 들어오는 미니멀 인테리어 서재. 밝은 원목 책상, 린넨 소재 의자, 창가에 작은 식물 화분. 창문에서 들어오는 빛이 바닥에 그림자를 드리우는 장면. 먼지 입자가 빛 속에 부유하는 느낌. 아키텍처 포토그래피 스타일, 35mm 렌즈 느낌'이라고 세밀한 내용을 담았다. 먼지 입자가 빛 속에 부유하는 느낌을 살리는 데는 한계가 있었지만, 창가 식물 화분의 그림자가 크기와 방향까지 정교하게 표현돼 완성도 높은 결과물이라는 인상을 받았다.

이미지 생성에 1분 내외 소요, 한계도 명확

챗GPT 이미지 2.0를 통해 생성한 결과물은 무료 플랜임에도 불구하고 만족스러웠다. 결과물 완성까지 모두 1분 내외 걸리는 수준이었다. 게다가 텍스트만으로 다양한 콘텐츠를 제작할 수 있는 만큼 실용성도 높아졌다.

다만 '생각하는 이미지 AI'라는 핵심 가치는 유료 구독 뒤에 잠겨 있다. 무료 플랜은 성능이 개선된 이미지 생성 엔진을 쓰는 수준으로 보는 것이 현실적이며, 7장 이상 생성이 필요한 작업에서는 한계가 명확하다.

챗GPT 이미지 2.0을 선보인 오픈AI / 출처=오픈AI
챗GPT 이미지 2.0을 선보인 오픈AI / 출처=오픈AI

모델 자체의 한계도 있다. 오픈AI는 공식 블로그를 통해 종이접기·루빅스큐브 같은 물리 세계 모델링, 가려지거나 기울어진 표면의 디테일 표현, 매우 촘촘하거나 반복적인 시각 요소 등이 챗GPT 이미지 2.0의 한계라고 직접 명시했다.

챗GPT 이미지 2.0은 텍스트 표현과 사진 사실성에서는 전작 대비 뚜렷한 진전을 보였지만, 핵심 기능의 유료 장벽과 불투명한 한도 정책은 아쉬움으로 남는다. 향후 무료 플랜의 생성 한도 확대 여부가 일반 사용자 입장에서는 가장 중요한 변수가 될 것으로 보인다.

여러분이 발견한, 혹은 관심이 가는 인공지능 서비스와 기능이 있으면 itdonga@itdonga.com으로 메일을 보내주세요. 써 본 후 IT동아 기자들이 이해하기 쉽고 자세하게 알리겠습니다.

IT동아 박귀임 기자(luckyim@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.