KAIST 'AI 4대 석학'과 AI 확산모델 개발

입력 2025-07-20 17:53
수정 2025-07-21 00:38
KAIST는 안성진 전산학부 교수 연구팀이 세계 인공지능(AI) 4대 석학으로 꼽히는 요슈아 벤지오 캐나다 몬트리올대 교수와 ‘확산(디퓨전) 모델’을 더 빠르고 효율적으로 작동시킬 수 있는 신기술을 개발했다고 20일 발표했다.

‘스테이블 디퓨전’ 등 텍스트를 바탕으로 새로운 이미지를 생성하는 확산 모델은 생성형 AI의 핵심 기술로 주목받는다. 하지만 생성 시간이 오래 걸리고 연산 자원을 늘려도 성능이 크게 개선되지 않는 한계가 있었다.

안 교수와 벤지오 교수 연구팀은 확산 모델의 ‘추론-시간 확장성’을 향상한 기술을 개발했다. 추론-시간 확장성은 AI가 연산 자원의 양에 따라 성능을 유연하게 조절할 수 있는 능력을 뜻한다. 기존 확산 모델은 단순히 데이터양을 늘리거나 모델을 키우는 방식만으로는 성능을 충분히 끌어올릴 수 없었다.

연구팀은 이런 문제를 해결하기 위해 ‘몬테카를로 트리 탐색’ 기법을 적용한 새로운 추론 방식을 제안했다. 다양한 생성 경로를 트리 구조로 탐색해 제한된 자원 안에서도 고품질의 결과물을 낼 수 있도록 하는 방식이다. 연구팀은 기존 모델이 전혀 풀지 못한 초대형 미로 찾기 과제에서 100% 성공률을 기록하며 기술력을 입증했다. 후속 연구에서는 확산 모델의 속도까지 높이는 데 성공했다. 트리 탐색 구조를 병렬 처리해 기존보다 최대 100배 빠른 속도로 동일하거나 더 나은 품질의 결과를 얻었다는 설명이다.

이번 연구 성과는 최근 캐나다에서 열린 세계 최고 권위의 인공지능 학회인 ‘국제기계학습학회(ICML) 2025’에서 전체 논문 중 상위 2.6%에 해당하는 스포트라이트 논문으로 선정돼 기술력을 인정받았다. 안 교수는 “이번 연구는 고비용 계산이 요구되던 기존 확산 모델의 한계를 근본적으로 극복한 기술”이라며 “지능형 로봇, 생성 AI 등 다양한 정보기술(IT) 분야에서 핵심 기술로 활용될 수 있을 것”이라고 말했다.

최영총 기자 youngchoi@hankyung.com