[위클리AI] 오픈AI 챗GPT 이미지 공개에 구글 제미나이3 플래시 출시까지 '각축전'

[IT동아 박귀임 기자] 인공지능(AI)이 세상을 바꾸고 있습니다. AI는 이제 우리 일상에서 떼려야 뗄 수 없는 핵심적인 요소입니다. 한 주간 세계를 들썩이게 만든 글로벌 빅테크 기업부터 우리 일상에 직접 영향을 미칠 새로운 AI 소식까지 핵심만 짚어드립니다.

오픈AI, 챗GPT 이미지 공개…최대 4배 빠르다

오픈AI가 챗GPT 이미지를 공개했습니다 / 출처=오픈AI
오픈AI가 챗GPT 이미지를 공개했습니다 / 출처=오픈AI

글로벌 AI 기업 오픈AI(OpenAI)가 새로운 이미지 생성 모델 GPT 이미지 1.5를 기반으로 한 '챗GPT 이미지(ChatGPT Images)'를 공개했습니다. 전작인 GPT 이미지 1보다 이미지 보존과 편집에 더 특화된 것이 강점입니다.

오픈AI는 12월 16일(이하 현지 시간) 자사 공식 홈페이지에 이같이 알리며 "이제 처음부터 무언가를 만들거나 사진을 편집할 때 상상한 그대로의 결과물을 얻을 수 있습니다. 챗GPT 이미지는 세부 사항을 그대로 유지하면서 정밀한 편집을 수행하고 최대 4배 빠르게 이미지를 생성합니다"라고 설명했습니다.

챗GPT에 업로드한 이미지의 편집을 요청하면 사용자의 의도를 더 정확히 반영해 요청한 부분만 변경합니다. 뿐만 아니라 조명, 구도, 사람의 외형과 같은 요소는 입력 및 출력 이후 편집 전반에 걸쳐 일관되게 유지됩니다. 이를 통해 사용자 의도에 부합하는 결과를 얻을 수 있습니다. 이에 따라 챗GPT는 실용적인 편집과 표현적인 재구상을 모두 수행할 수 있는 이른바 '주머니 속 크리에이티브 스튜디오'로 작동합니다.

오픈AI에 따르면 모바일 앱 사이드바와 웹에서 사용할 수 있는 이미지 전용 공간도 챗GPT에 도입합니다. 이를 통해 이미지 탐색과 시도를 더 빠르고 쉽게 할 수 있습니다. 전용 공간에는 이미지를 즉시 구현할 수 있도록 수십 개의 사전 설정 필터와 프롬프트가 포함되며, 최신 트렌드를 반영해 정기적으로 업데이트됩니다.

업무적으로도 유용합니다. 챗GPT 이미지가 더 빠른 이미지 생성, 정밀한 편집, 반복 작업 전반에 걸친 일관된 시각적 디테일로 비즈니스 워크플로우를 간소화할 수 있기 때문입니다. 복잡하거나 단순한 개념을 시각화할 수 있어 마케팅, 디자인, 이커머스, 내부 커뮤니케이션 전반으로 활용 가능힙니다.

이번 챗GPT 이미지는 많은 것을 시사합니다. 챗GPT에 이미지 기능을 통합, 텍스트 채팅부터 코드와 이미지 생성 및 편집까지 한 인터페이스에서 오갈 수 있도록 만들었습니다. 이는 모든 작업을 챗GPT 안에서 처리하게 만드는 락인 효과를 강화하는 전략이라고 볼 수 있습니다. 또 비용 인하, 속도 향상, 품질 개선 등 실무 활용에 한발 더 다가간 모델로도 평가됩니다. 단순히 멋진 그림을 보여주는 도구에서 실무용은 물론 반복 편집 가능한 비주얼 워크플로 플랫폼으로 전환을 선언했다는 점에서도 의미가 큽니다.

특히 구글 제미나이의 이미지·비디오 모델인 나노바나나 프로가 시장 점유율을 확대하는 가운데 챗GPT 이미지가 공개된 만큼 더욱 치열한 경쟁을 예고했습니다.

구글, 제미나이3 플래시 출시 "최첨단 인텔리전스 저렴하게 제공"

구글이 제미나이3 플래시를 출시했습니다 / 출처=구글
구글이 제미나이3 플래시를 출시했습니다 / 출처=구글

글로벌 빅테크 전문기업 구글(Google)이 12월 17일 최첨단 인텔리전스를 탑재한 최신 경량 모델 '제미나이3 플래시(Gemini 3 Flash)'를 선보였습니다.

제미나이3 플래시는 속도를 위해 설계된 최첨단 인텔리전스를 훨씬 저렴한 가격으로 제공합니다. 추론·멀티모달·코딩·에이전트 기능을 유지하면서도 지연 시간을 크게 줄인 것도 특징입니다.

앞서 구글은 제미나이3의 최상위 모델인 딥싱크(Deep Think)와 균형 모델인 프로(Pro)를 출시한 바 있습니다. 이를 통해 복잡한 추론, 멀티모달 및 비전 이해, 에이전트 및 바이브 코딩 작업 전반에 걸쳐 최첨단 성능을 선보였습니다. 제미나이3 플래시는 이러한 기반을 유지하면서 제미나이3의 전문가급 추론 성능과 비용 효율성을 결합했습니다. 결과적으로 일상적인 작업을 향상된 추론으로 수행할 수 있을 뿐만 아니라 에이전트 워크플로우를 위한 가장 뛰어난 모델이기도 합니다.

제미나이에서 제미나이3 플래시 모델이 기본으로 설정돼 기존 2.5 플래시를 대체합니다. 즉 전 세계 모든 제미나이 사용자는 추가 비용 없이 제미나이3 환경을 이용할 수 있게 됐습니다.

이처럼 제미나이3 플래시는 기존의 '작고 빠른 모델은 성능을 타협해야 합니다'라는 공식을 깨며 주목받고 있습니다. 여러 벤치마크에서 제미나이3 프로에 근접하는 성능을 보여주면서도 훨씬 저렴한 가격대를 제시하기 때문입니다. 무엇보다 기본 모델로 제미나이3 플래시를 적용, 사용자가 자연스럽게 쓰게 만들어 생태계 확장을 노린 행보로 해석됩니다. 앞으로 AI 모델 경쟁이 '누가 더 크고 똑똑한가'보다 '누가 더 많은 가치를 낼 수 있는가'로 바뀌고 있는 신호탄이라고도 할 수 있습니다.

엔비디아, 스케드MD 인수로 오픈소스 생태계 강화

엔비디아가 스케드MD를 인수했습니다 / 출처=엔비디아
엔비디아가 스케드MD를 인수했습니다 / 출처=엔비디아

글로벌 AI 반도체 전문기업 엔비디아(NVIDIA)가 오픈소스 AI 컴퓨팅 작업량 관리 도구 슬럼(Slurm)의 개발사 스케드MD(SchedMD)를 인수했습니다. 슬럼은 수천 개의 AI칩에 작업을 효율적으로 분배하고 관리하는 스케줄러입니다. 세계 500대 슈퍼 컴퓨터 시스템 중 절반 이상이 사용하는 도구이기도 합니다.

엔비디아는 12월 17일 자사 공식 홈페이지를 통해 해당 소식을 전하며 "스케드MD 인수를 통해 오픈소스 소프트웨어 생태계를 한층 강화하며, 연구자·개발자·기업 전반의 AI 혁신을 주도할 계획입니다"라고 밝혔습니다.

이어 "슬럼을 오픈소스, 벤더 중립 소프트웨어로 지속적으로 개발하고 배포하며 다양한 하드웨어와 소프트웨어 환경에서 더 넓은 HPC(High Performance Computing, 고성능컴퓨팅)·AI 커뮤니티가 활용할 수 있도록 지원할 예정"이라면서 "슬럼이 HPC와 AI 분야의 선도적인 오픈소스 스케줄러로 자리매김할 수 있도록 지속적으로 개발에 투자할 계획"이라고 덧붙였습니다.

엔비디아는 10년 이상 스케드MD와 협력해 왔습니다. 최신 엔디비아 하드웨어에서 지원되는 슬럼은 생성형 AI에 필요한 핵심 인프라의 일부로, 파운데이션 모델 개발자와 AI 개발자들이 모델 훈련 및 추론 요구사항을 관리하는 데 사용됩니다.

대니 오블(Danny Auble) 스케드MD 최고경영자는 "엔비디아와 힘을 합치게 돼 매우 기쁩니다. 이번 인수는 세계에서 가장 까다로운 HPC와 AI 환경에서 슬럼이 수행하는 핵심적인 역할을 입증하는 결정적인 사례입니다. 가속 컴퓨팅 분야에 대한 엔비디아의 깊은 전문성과 투자는 슬럼의 개발을 한층 강화해 차세대 AI와 슈퍼컴퓨팅의 요구를 충족시키는 데 기여할 것입니다"라고 말했습니다.

스케드MD 인수는 엔비디아가 GPU를 넘어서 AI 및 HPC 데이터센터의 스케줄러·운영 체계까지 장악할 뜻을 드러낸 전략적 행보로 해석할 수 있습니다. 이는 하드웨어는 물론 운영 스택 선택까지 엔비디아 중심으로 재편될 수 있음을 의미합니다. 단기적으로는 개발 리소스·지원 체계가 강화되는 긍정 효과가 기대되지만, 향후 엔비디아 편향 최적화가 심해질 가능성도 제기되는 이유입니다.

IT동아 박귀임 기자(luckyim@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.