서경국 울산과학기술원(UNIST) 인공지능대학원 연구원(왼쪽)과 유재준 교수. UNIST 제공.
민감 데이터를 서버로 보내지 않고도 고품질 이미지를 생성할 수 있는 초경량 인공지능(AI) 모델이 개발됐다. 자기공명영상(MRI), 컴퓨터단층촬영(CT) 등으로 촬영한 환자 정보 등을 보호할 때 적용할 수 있을 것으로 기대된다.
울산과학기술원(UNIST)은 유재준 인공지능대학원 교수팀이 한동준 연세대 교수와 연합학습 AI 모델인 프리즘(PRISM)을 개발했다고 9일 밝혔다.
연합학습은 민감 정보가 포함된 데이터를 직접 서버에 올리지 않고 ‘로컬 AI’가 학습한 결과만 서버에 전송해 ‘글로벌 AI’를 만드는 기술이다. 로컬 AI는 인터넷 없이 작동하는 AI이고 글로벌 AI는 중앙 서버에서 데이터를 처리하는 AI다.
연구팀이 개발한 프리즘은 연합학습 과정에서 로컬 AI와 글로벌 AI를 연결하는 학습 중재자 역할의 AI 모델이다. 로컬 AI는 각각 가진 데이터와 성능 편차가 크기 때문에 중재자 역할 AI는 어떤 로컬 AI 정보가 더 믿을만하고 더 많이 반영해도 될지 판단·조율해야 한다.
프리즘은 기존 모델보다 통신 비용은 평균 38%, 크기는 48% 감소한 1비트 수준의 초경량형 모델이다. 스마트폰, 태블릿PC 등 소형 장비의 중앙처리장리(CPU)나 메모리에서 부담 없이 작동한다.
연구팀이 개발한 프리즘(PRISM)이 기존 방식보다 높은 품질의 이미지를 생성한다. UNIST 제공.
프리즘은 AI 성능 검증에 쓰는 데이터셋인 MNIST, FMNIST, CelebA, CIFAR10 실험에서 기존 방식보다 통신량은 적으면서 이미지 생성 품질은 높다는 점도 확인됐다. MNIST 데이터셋을 이용했을 땐 지브리풍 이미지를 생성하는 디퓨전 모델(이미지 생성 AI)과도 호환성을 보였다.
최근 챗GPT로 셀카를 지브리풍으로 바꾸는 이미지 생성이 유행하고 있는데 사진을 서버에 올려야 한다는 문제가 있다. 개인정보 침해 우려가 있다는 것이다. 연구팀은 “프리즘을 이용하면 모든 처리가 스마트폰 안에서 이뤄져 사생활 침해를 막으면서도 빠른 결과를 받아볼 수 있다”며 “단 스마트폰에서 이미지를 직접 생성하는 로컬 AI 모델 개발은 별도로 필요하다”고 말했다.
연구팀은 모든 정보를 공유하는 대용량 파라미터 방식 대신 중요 정보만 선별해 공유하는 ‘이진 마스크’ 방식을 적용해 프리즘의 통신 효율을 높였다. 생성 품질을 정밀하게 평가하는 손실 함수(MMD)와 각전 로컬 AI의 기여도를 집계하는 략(MADA)으로 데이터 편차와 학습 불안정성도 해소했다.
유재준 교수는 "프리즘은 이미지뿐만 아니라 텍스트 생성, 데이터 시뮬레이션, 자동 문서화 등 다양한 생성 AI 분야에 적용할 수 있다"며 "의료, 금융 등 민감 정보를 다루는 분야에서 효과적이고 안전한 솔루션이 될 것"이라고 말했다. 연구 결과는 세계 3대 인공지능 학회 중 한곳인 ‘표현학습국제학회(ICLR) 2025’에서 발표될 예정이다. ICLR은 24~28일 싱가포르에서 열린다.
<참고 자료>
doi.org/10.48550/arXiv.2503.08085
[문세영 기자 moon09@donga.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.