오픈AI, 자율성 높인 GPT-5.5 출시…"앤트로픽과 비교해보라"

입력 2026-04-24 04:56
오픈AI, 자율성 높인 GPT-5.5 출시…"앤트로픽과 비교해보라"

"앤트로픽 모델은 데이터 암기 징후 있어"…미토스와 비교엔 답변 회피하기도



(샌프란시스코=연합뉴스) 권영전 특파원 = 연내 기업공개(IPO)를 노리는 오픈AI가 두 달만에 새 인공지능(AI) 모델을 선보이며 앤트로픽의 주도권 경쟁에 불을 지폈다.

오픈AI는 23일(현지시간) 새 AI 모델 'GPT-5.5'를 공개하면서 "현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 모델"이라고 소개했다.

오픈AI가 공개한 성능지표(벤치마크) 보고서를 보면 GPT-5.5는 상당수 영역에서 앤트로픽의 주력 모델인 '클로드 오퍼스4.7'보다 높은 점수를 받았다.

지식 업무 수행 능력을 평가하는 'GDPval' 지표는 84.9%를 받아 80.3%에 머무른 오퍼스4.7을 능가했다.

또 터미널 환경 작업 능력인 '터미널-벤치 2.0'에서는 82.7%를 기록해 오퍼스4.7(69.4%)을 10%포인트(p) 이상 앞섰고, 사이버 보안 능력을 평가하는 '사이버짐'에서도 81.8%로 오퍼스4.7의 73.1%를 뛰어넘었다.

다만 정보기술(IT) 업계에서 가장 수요가 높은 코딩 부문 지표인 'SWE-벤치 프로'에서는 58.6%에 그쳤다. 오퍼스4.7이 64.3%라는 점을 고려하면 5%p 이상 격차가 나는 셈이다.

그러나 오픈AI는 "앤트로픽의 모델은 데이터 암기 징후가 보고됐다"며 평가 결과를 인정할 수 없다는 반응을 보였다.

오픈AI는 이전에도 앤트로픽의 AI 모델이 80% 이상의 점수를 받는 'SWE-벤치 베리파이드' 지표의 평가 데이터가 오염됐다며 해당 지표를 더 이상 쓰지 않겠다고 밝힌 바 있다.

오픈AI 측은 이날 화상 브리핑에서 앤트로픽의 '미토스'의 성능을 비교하는 질문에 "모델이 매우 정확하다"며 성능지표를 확인해보라고 답했다.

다만 매개변수(파라미터) 수가 미토스(10조 개)보다 더 많은지에 대한 질문에는 "매개변수 수는 답하기 어렵다"고 답을 회피했다.

오픈AI는 특히 GPT-5.5가 에이전트형 연산에 더 적합하도록 자율성과 직관성을 높였다고 강조했다.

그레그 브록먼 오픈AI 사장은 "이 모델이 정말 특별한 점은 더 적은 지침으로도 더 많은 일을 할 수 있다는 것"이라며 "불분명한 문제를 보고 다음에 무엇을 해야 하는지 스스로 파악해낸다"고 설명했다.

그러면서 그는 "내게는 이것이 우리가 앞으로 컴퓨터를 사용하는 방식과 대규모 에이전트형 연산이 어떻게 작동할지에 대한 기초를 다지는 것처럼 느껴진다"고 소개했다.

오픈AI는 GPT-5.5가 전작인 GPT-5.4보다 더 높은 성능을 보이면서도 토큰당 대기시간은 동일하게 유지했다는 점을 내세우면서 "더 이상 성능을 위해 속도를 희생할 필요가 없다"고 말했다.

comma@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>