클라우드플레어 "취약점 연결해 실제 공격 가능성 추론"
가드레일 일관성 한계…"상용화 전 안전장치 보강 필요"

(서울=연합뉴스) 권하영 기자 = 앤트로픽의 비공개 인공지능(AI) 모델 '미토스'가 기존 자동화 보안 스캐너를 넘어 선임 연구원 수준의 취약점 분석 능력을 갖춘 것으로 나타났다.
방어용으로 개발된 이 모델의 능력이 공격에도 그대로 전용될 수 있다는 우려도 함께 제기됐다.
클라우드플레어는 20일 앤트로픽의 고성능 AI 보안 모델 '클로드 미토스 프리뷰'를 자체 코드 저장소 50개 이상에 적용해 분석한 결과 보고서를 공개했다.
미국 네트워크 인프라 기업 클라우드플레어는 앤트로픽이 미토스의 보안 위험성을 관리하기 위해 구글, 마이크로소프트(MS), 애플, 엔비디아 등 주요 기업·기관 52곳과 구성한 글로벌 AI 보안 협력체 '프로젝트 글래스윙'에 참여해 이 모델에 대한 제한적 접근 권한을 부여받았다.
◇ "작은 버그들 연결해 실제 공격으로"
보고서를 작성한 그랜트 부지카스 클라우드플레어 최고보안책임자(CSO)는 미토스 프리뷰를 "분명히 진전"이라고 평가하며, 모델의 익스플로잇(취약점 침투) 체인 구성과 개념 증명 능력을 주목했다.
먼저 취약점을 악용하는 코드 생성과 관련해 미토스는 1개 취약점만 활용하는 것이 아닌 여러 개의 소규모 취약점을 조합해 하나의 작동 가능한 공격 가능성을 추론하는 실전 역량을 갖추고 있다고 설명했다.
이 과정에서 나타나는 추론은 "자동 스캐너의 출력물이 아니라 선임 연구원의 작업처럼 보인다"는 평가다.
개념 증명 영역에서도 단순히 취약점을 찾는 데 그치지 않고 해당 취약점이 실제로 악용 가능한지 증명하는 역할을 해내는 것으로 나타났다.
미토스는 버그를 유발하는 코드를 직접 작성하고 이를 임시 환경에서 실행한 뒤, 예상대로 작동하지 않으면 가설을 수정해 다시 시도하는 과정을 스스로 반복했다.
보고서는 "기존 프런티어 모델들도 개별 취약점 발견하거나 분석을 제공하는 경우가 있었지만 취약점들을 연결하는 단계에서 번번이 멈췄다면, 미토스 프리뷰는 백로그에 묻혀 있던 낮은 심각도의 버그들을 연결해 단일한 고위험 익스플로잇으로 완성하는 것이 가능하다는 점에서 차별화됐다"고 분석했다.
또한 미토스는 자체 가드레일을 통해 일부 요청에 거부 반응을 보이긴 했지만 일관성이 떨어지는 것으로 파악됐다.
동일한 코드에 대한 취약점 연구를 처음에는 거부했다가 관련 없는 환경 변경 이후 수행에 응하거나, 심각한 메모리 버그를 발견하고도 시연용 익스플로잇 작성을 거절한 뒤 요청 방식을 달리 했을 때는 응하는 식이었다.

◇ "방어용 능력, 공격에도 그대로"…구조적 대응 촉구
클라우드플레어는 미토스가 가진 능력이 방어와 공격 양쪽에 모두 적용될 수 있다는 점을 경고했다.
보고서는 "이 주제가 양날의 검과 같다는 점을 분명히 인식하고 있다"며 "자사 코드의 버그를 찾는 데 활용한 동일한 능력이 잘못된 손에 들어가면 인터넷상의 모든 애플리케이션에 대한 공격을 가속화할 것"이라고 강조했다.
단순히 패치 속도를 높이는 것만으로는 대응하기 어려우며, 향후 이 같은 AI 모델이 일반에 공개되려면 현재의 기본 동작 위에 추가적인 안전장치가 반드시 갖춰져야 한다는 지적이다.
근본적인 해법으로는 취약점이 존재하더라도 공격자가 이를 활용할 수 없도록 애플리케이션 접근 제어, 일부 코드 결함 확산 방지, 코드 배포·수정 동시 적용 등 구조적 방어 체계 구축을 제안했다.
kwonhy@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>