지브리 스타일 열풍 속 '이미지 생성 AI' 미드저니, 1년 만에 새 모델 'V7' 출시

조회 3162025. 4. 6.
(사진=미드저니)

챗GPT의 이미지 생성 인공지능(AI)이 만드는 '지브리 스타일' 열풍이 세계를 휩쓸고 있다. 그 덕에 챗GPT 가입자가 지난달 말 기준 5억명을 돌파했다. 특히 새로운 이미지 생성기가 출시된 이후 1억 3000만명 이상의 사용자가 7억개가 넘는 이미지를 생성했다.

'지브리 스타일' 열풍은 AI 모델들의 멀티모달 구조가 확장되고 있음을 방증한다. 그저 텍스트 프롬프트로 이미지를 만드는 것을 넘어, 충실도가 높고 텍스트에 대한 높은 이해력을 가진 AI가 부상하고 있는 셈이다.

강력한 멀티모달 기능을 갖춘 오픈AI의 새로운 이미지 생성 기능에 기존 이미지 생성 AI 시장 구도가 흔들리고 있다. 이에 따라 점유율에 타격이 우려되자 이미지 생성 AI 기업들은 발걸음을 재촉하고 있는 모양새다.

새로운 기능으로 편집한 이미지. (사진=미드저니)

이미지 생성 AI 시장의 선두주자로 꼽히는 미드저니(Midjourney)는 최근 약 1년 만에 최신 AI 모델 'V7'을 출시했다. 미드저니는 공식 엑스(X)를 통해 'V7' 알파 버전을 출시한다고 밝혔다.

기존 모델보다 비교해 사실적인 이미지 제작에 특화됐다는 게 미드저니 측의 설명이다. 이용자의 선호도에 맞게 이미지를 제작하는 '개인화 기능'도 도입됐다. 이용자들은 먼저 약 200개의 이미지를 평가하고, 이 과정을 통해 사용자가 어떠한 사진을 선호하는지 AI가 분석한다.

이미지 초안을 최대 10배 빠르게 제작할 수 있는 '드래프트 모드'도 도입됐다.다만 표준 모드보다 더 낮은 품질의 이미지를 생성한다.

V7은 '터보'와 '릴랙스' 모델 두 가지 버전으로 출시된다. V7은 이미지 업스케일링, 리텍스처링 등 기본 기능이 아직까지 제공되지 않고 있다. 미드저니 측은 두 달 이내 기본 기능 등을 도입할 것이라고 밝혔다.

미드저니의 새로운 리텍스처링 기능. (영상=미드저니, 편집=AI포스트)

현재 인기를 끌고 있는 '지브리 스타일' 이미지는 미드저니 V7에서 생성할 수 없는 것으로 알려졌다. 이미지 생성 인공지능(AI) 스테이블디퓨전 개발사인 스태빌리티 AI도 바쁘게 움직이고 있다. 스태빌리티 AI는 2D 이미지를 3D 영상으로 변환하는 기능을 최근 공개한 바 있다.

3D 애니메이션, 영화 제작 등에 활용할 수 있는 고성능 AI 도구 개발에 매진하고 있다. 구글은 지난 2월 이미지 생성 AI 도구 '위스크(Whisk)'를 한국을 비롯한 100개국에 출시했다. 위스크는 '지브리 스타일' 이미지를 생성하는 것처럼 참고용 사진만으로 새로운 작품을 만든다는 게 특징이다.

위스크는 구글의 이미지 생성 모델인 '이매진(Imagen)'을 기반으로 구동된다. 이미지의 주요 특징을 추출하기 때문에 결과물이 기존 사진과 다르게 나타날 수도 있다.

예를 들어 인물 사진을 올렸을 경우 피사체의 키나 체중, 헤어스타일, 피부 톤이 다를 수도 있다는 의미다. 구글 측은 픽셀 단위의 조정을 통해 완벽한 사진을 만드는 것이 아니라 빠르게 창의적인 사진을 만들기 위해 위스크를 개발했다고 밝힌 바 있다.

일론 머스크 테슬라 CEO가 이끄는 xAI도 이미지 생성 챗봇을 무료로 제공하고 있다.

AI포스트(AIPOST) 유진 기자

■ 보도자료 및 광고, 비즈니스 협업 문의 aipostkorea@naver.com

Copyright © AI포스트(AIPOST)

이 콘텐츠가 마음에 드셨다면?