언어 모델 대신 집중 공략
그래픽=김의균· DALL-E
세계적인 명품 기업 ‘루이비통모에헤네시(LVMH)’는 자사 명품 브랜드의 위조품을 인공지능(AI) 기술을 통해 잡아내고 있다. 각종 전자상거래 사이트와 소셜미디어에 올라온 가짜 명품 이미지를 AI가 24시간 탐지·분석하고, 증거 수집부터 신고까지 자동으로 수행한다. 이 기술을 개발한 곳은 한국 창업자가 세운 스타트업 ‘마크비전’이다. 컨설팅 기업 맥킨지 출신 이인섭 대표가 2019년 미국에서 창업한 마크비전은 LVMH뿐 아니라 전 세계 300개 글로벌 브랜드와 콘텐츠 기업을 고객으로 두고 있다. 가짜 명품뿐 아니라 라이선스 없이 무단 판매되는 제품이나 불법 웹툰·영화 같은 유통 콘텐츠까지 잡아낸다. 지난해 적발한 위조·무단 판매 상품과 불법 콘텐츠만 5041만건. 글로벌에서 연간 1700만달러(약 250억원)를 벌어들이고 있다.
이미지나 영상에 특화된 비(非)언어용 AI 기술을 개발한 K스타트업이 해외에서 큰 성과를 거두고 있다. 대규모 언어 모델(LLM)은 오픈AI·구글·마이크로소프트·메타같이 자금력을 갖춘 미국 빅테크들이 장악했다. 하지만 영상과 이미지 AI 분야에선 특정 산업에 특화된 AI 기술을 오래 갈고닦은 스타트업이 경쟁 우위를 갖고 있다. 특히 이미지·영상 관련 AI 기술은 향후 자율 주행을 비롯한 여러 영역에서 핵심 역할을 할 것이라는 전망이 나온다.
◇해외서 잘나가는 국내산 非언어 AI
지난해 한국 스타트업 최초로 AI 반도체 기업 ‘엔비디아’의 대규모 투자를 유치해 주목받은 ‘트웰브랩스’ 역시 AI 영상 검색 기술을 개발해온 곳이다. 예컨대 1시간이 넘는 영상에서 ‘남성이 사무실에서 펜을 들고 있는 부분’을 찾아달라고 하면, AI가 1초 만에 해당 장면을 찾아준다. 북미 최대 스포츠 엔터테인먼트 기업 MSLE와 미식축구협회(NFL) 같은 곳은 이미 트웰브랩스의 AI 기술을 사용하고 있다. 각종 스포츠 경기 영상을 AI로 분석해 원하는 장면을 찾아내주고 이를 편집해 새 콘텐츠도 만들 수 있는 기능이다.
MRI(자기공명영상)나 CT(컴퓨터 단층 촬영) 같은 비언어 데이터가 중요한 의료 분야에서도 한국 AI 스타트업이 약진하고 있다. 의료용 AI 스타트업 ‘에어스메디컬’은 AI 기술을 활용해 MRI 사진의 해상도와 촬영 속도를 높이고 영상 복원도 해주는 소프트웨어를 개발했다. 미국과 영국, 독일, 일본 등 26국 460개 의료 기관에 공급 중이고 수십억원 규모 매출 중 절반 이상이 해외에서 나온다. AI로 한 사람의 모든 유전 정보를 분석해 암 진단과 맞춤형 치료 전략에 활용할 수 있는 AI 기술을 개발한 스타트업 ‘이노크라스’ 역시 해외에서 먼저 그 기술력을 인정받았다. 이노크라스는 미국 MIT(매사추세츠 공대)·하버드대 산하 게놈 연구기관 브로드 인스티튜드와 손잡고 세계 최대 암 환자 공공 데이터베이스(TCGA)를 공동 재분석하는 프로젝트를 진행 중이다.
그래픽=김의균
◇“언어 모델보다 데이터 확보 유리”
한국 스타트업이 개발한 비언어 AI 기술이 해외에서도 경쟁력을 갖는 배경으로는 개발 난도가 기존 언어 모델 대비 낮다는 데 있다. AI 모델을 학습시키기 위해서는 문자 데이터가 필요한데, 대부분 영문 데이터가 핵심이다 보니 글로벌 빅테크에 비해 데이터 접근성이 떨어진다는 문제가 컸다. 에어스메디컬과 이노크라스에 투자한 두나무앤파트너스의 이강준 대표는 “의료용 데이터의 경우 한국은 서울 5대 병원과 심평원에 의해 의료 데이터가 집중돼 있다는 점이 장점”이라며 “미국에선 미국 전역의 여러 병원에 접촉하고 데이터를 받아야 하기에 개발 난도가 더 높다”고 말했다. 특정 산업에 집중한 AI 모델이라는 점 역시 유효했다. 마크비전 관계자는 “전자상거래가 발달한 아시아 국가에선 학습용 가품 이미지 데이터 확보도 보다 유리하다”며 “챗GPT 등장 전부터 오랜 기간 개발해 온 AI 기술이 해외에서 인정받은 것”이라고 말했다.
Copyright © 조선일보. 무단전재 및 재배포 금지.