'챗GPT 이미지' 공개
오픈AI, 새 이미지AI 출격 "교육 혁명 이끌 것"
현실 세계에 없는 이미지 만들고
텍스트 쓴 복잡한 구조도 생성
광고·인포그래픽·마케팅 등
산업 콘텐츠 시장 대격변 예고
챗GPT에 “바퀴가 삼각형인 자전거를 그려줘”라고 입력하자 화면에 삼각형 모양의 바퀴가 달린 자전거가 등장했다. “뉴턴의 프리즘 실험을 인포그래픽으로 만들어줘”라는 요청에는 창에서 비친 빛이 프리즘을 통과해 무지개 형태로 뻗어나가는 모습을 그린 이미지 위에 세세한 텍스트 설명이 적힌 인포그래픽(사진)이 뚝딱 완성됐다.
오픈AI가 25일 새로운 이미지 생성형 인공지능(AI) 모델 ‘챗GPT 4-o 이미지 제너레이션’(챗GPT 이미지)을 공개했다. AI가 상상력을 동원해 현실 세계에는 없는 이미지를 만들어낸다는 게 특징이다. 기존 이미지 생성 AI의 약점으로 꼽힌 세심한 묘사 능력과 이미지 위에 텍스트를 쓰는 능력도 끌어올렸다. 이미지 생성 AI가 상상력과 정확성을 무기로 장착하며 콘텐츠·마케팅·교육 등 산업 전반에 미칠 파급력이 만만치 않을 것으로 전망된다.
◇“생성 이미지 속 텍스트도 온전”
그동안 이미지 생성 AI는 ‘디테일’에 약하다는 평가를 받아왔다. 전체 그림을 생성하는 능력은 탁월해도 정교한 비율 처리나 복잡한 구조를 그릴 때면 어딘가 어색한 이미지를 구현해냈다. 대표적인 게 손이다. 사람 손가락을 6개로 그리거나 손톱 모양을 이상하게 만드는 등의 오류가 잦았다.
실제 존재하지 않는 형태의 물건을 생성하거나 이미지 속에 텍스트를 쓰는 것에서도 약점을 드러내곤 했다. ‘바퀴가 삼각형인 자전거’를 찾는 명령에 프레임만 삼각형인 자전거를 그려내는 식이다.
이를 해결하기 위해 오픈AI는 챗GPT 이미지를 기존 챗GPT에 완전히 통합하는 방식을 택했다. 챗GPT의 텍스트 이해 및 추론 능력이 크게 높아진 만큼 여기에 새 모델의 이미지 생성 능력을 결합하면 이 같은 오류를 크게 줄일 수 있을 것이란 판단에서다. 재키 섀넌 오픈AI 멀티모달 담당은 “GPT 4-o의 ‘텍스트 지능’과 이번 모델의 ‘이미지 지능’을 하나의 통일된 프레임워크에 결합해 엄청난 개선을 이뤄냈다”고 설명했다.
◇콘텐츠 시장 대격변 예상
이미지 생성 AI가 급속도로 고도화되면서 콘텐츠 및 광고 시장에 대격변이 예상된다. 그동안 이미지 생성 AI를 콘텐츠 생성에 본격적으로 도입하지 못하던 최대 약점인 텍스트 깨짐 등의 문제점이 해결되고 있어서다. 뉴턴의 프리즘 실험처럼 텍스트만으로 설명하기 어려운 과학 이론도 AI가 손쉽게 이미지로 풀어내며 교육 분야에서도 유용하게 쓰일 것으로 보인다. 가브리엘 고 오픈AI 멀티모달 담당은 “이 모델은 교육에서 일종의 혁명을 일으킬 것”이라고 강조했다. 이런 산업적 파급력에 힘입어 지난해 87억달러(약 12조8000억원)이던 이미지 및 영상 생성 AI 시장 규모는 2030년 608억달러(약 89조4000억원)까지 불어날 것으로 전망된다.
오픈AI는 AI 고도화와 함께 대대적인 조직 개편도 서두르고 있다. 샘 올트먼 오픈AI 최고경영자(CEO)는 지난 24일 브래드 라이트캡 최고운영책임자(COO)의 역할을 대폭 확대하고 자신은 기술 개발에 집중하겠다고 발표했다. 최고인사책임자(CHO)와 최고연구책임자(CRO) 자리도 신설했다. 영리법인화 움직임 이후 줄줄이 회사를 떠난 핵심 인재의 자리를 대체하는 한편 새로운 투자 유치를 위해 큰 변화를 기꺼이 감수하겠다는 신호를 보내는 것으로 해석된다.
실리콘밸리=송영찬 특파원
Copyright © 한국경제. 무단전재 및 재배포 금지.