글 완벽하게 이해하고 표현하는
GPT-4o 이미지 생성 모델 공개
그래픽 디자이너 일자리 위협
오픈AI의 GPT-4o 이미지 생성 모델이 생성한 '가장 인기 있는 칵테일 4종' 이미지. 글자를 깨짐 없이 표현하고, 그림과 해당 그림을 설명하는 글을 정확하게 연결시켰다. 오픈AI 제공
생성형 인공지능(AI) 챗GPT의 이미지 생성 기능이 크게 강화돼, 인포그래픽이나 웹툰처럼 복잡한 이미지도 생성할 수 있게 됐다. 오픈AI는 챗GPT에 '글'을 인식하고 표현하는 새로운 이미지 생성 AI 모델을 추가한다고 25일(현지시간) 밝혔다. 누구나 챗GPT에 말로 주문하기만 하면 글자가 포함된 정교한 이미지를 빠르게 만들어 낼 수 있게 된 것이다. 이 기능은 챗GPT 무료 버전에도 포함된다.
오픈AI의 GPT-4o 이미지 생성 모델이 생성한 인포그래픽. 미국 샌프란시스코에 왜 안개가 많이 끼는지를 그림과 글로 표현했다. 오픈AI 제공
오픈AI는 전날 일부 기자들을 대상으로 간담회를 열고 최신형 AI 모델 'GPT-4o'를 기반으로 개발된 이미지 생성 모델을 이날부터 챗GPT에 도입한다고 밝혔다. 지금까지 챗GPT에 이미지 생성을 주문하면 달리3(DALL-E 3)가 동원됐지만, 이제는 GPT-4o 이미지 생성 모델이 기본적으로 작동한다. 엄청나게 많은 양의 이미지를 집중적으로 학습한 달리와는 달리, 새 모델은 글과 이미지를 모두 학습한 멀티모달(시각, 청각 등 다양한 감각을 통해 정보를 주고받는 것) AI여서 '말귀'를 더 잘 알아듣고 '글 생성'도 잘한다는 게 특징이다. 달리가 예술적 표현에 능한 화가라면, GPT-4o 이미지 생성 모델은 정확한 이해와 표현에 강점이 있는 그래픽 디자이너인 셈이다.
"뉴턴의 프리즘 실험을 자세히 설명하는 인포그래픽을 만들어줘"라고 달리(위 사진)와 GPT-4o 이미지 생성 모델에 주문했을 때 생성해낸 이미지. 달리의 경우 글자를 전혀 알아볼 수 없게 생성한 반면, 새 모델은 그림과 설명 모두 명료하게 표현해 냈다. 챗GPT 캡처·오픈AI 제공
이날 오픈AI가 공개한 예시 이미지들을 보면, GPT-4o 이미지 생성 모델은 △복잡하고 구체적인 명령도 정확하게 이해하며 △사람 손가락을 6개로 표현하는 것과 같은 기본적인 실수를 하지 않고 △글자도 깨짐 없이 완벽에 가깝게 표현한다. 가령 "뉴턴의 프리즘 실험을 자세히 설명하는 인포그래픽을 만들어줘"라고 주문했을 때 달리의 경우 철자나 내용이 틀린 글, 심지어는 읽기 자체가 불가능한 외계어를 생성해 낸 반면, 새 모델은 그림과 설명 모두 명료하게 표현해 냈다. 정보를 담은 교육용 그래픽이나 홍보용 팸플릿, 웹툰 등 제작에 활용할 수 있다는 게 오픈AI의 설명이다.
오픈AI의 GPT-4o 이미지 생성 모델이 생성한 '맛차 만드는 법' 이미지. 글자를 깨짐 없이 표현하고, 그림과 해당 그림을 설명하는 글을 정확하게 연결시켰다. 오픈AI 제공
새 모델은 챗GPT 무료 이용자들도 사용할 수 있다. 단 무료 이용자의 경우 제한된 개수의 이미지만 생성할 수 있다고 오픈AI 측은 밝혔다. 오픈AI 관계자는 "한글도 표현이 가능하지만 알파벳에 비해서는 정교함이 떨어질 수 있다"고 말했다.
테크업계에서는 GPT-4o 이미지 생성 모델의 출시로 이미지 생성 AI 도구의 접근성과 활용성이 극대화할 것이라는 전망이 나온다. 이에 따라 AI의 일자리 위협에 대한 그래픽 디자이너들의 위기감은 더 커질 것으로 보인다.
실리콘밸리= 이서희 특파원 shlee@hankookilbo.com
Copyright © 한국일보. 무단전재 및 재배포 금지.