'익시젠' 취약점 점검…안전·편향·허위정보 등 7개 영역 검증

(서울=연합뉴스) 박형빈 기자 = LG유플러스[032640]의 통신 특화 인공지능(AI) 모델 '익시젠'이 생성형 AI의 안전성과 신뢰성을 검증하는 국제 행사에 참여한다.
LG유플러스는 다음 달 스페인 바르셀로나에서 열리는 MWC26 기간 중 진행되는 '글로벌 AI 레드팀 챌린지'에 익시젠을 출품한다고 19일 밝혔다.
글로벌 AI 레드팀 챌린지는 세계이동통신사업자연합회(GSMA)가 주관하는 AI 검증 프로그램으로, MWC와 공식 공동 개최되는 개발자·디지털 인재 행사의 핵심 프로그램 중 하나다.
LG유플러스는 LG AI연구원의 거대언어모델(LLM) '엑사원(EXAONE)'을 기반으로 개발한 익시젠을 출품해 실제 사용자 관점에서 발생할 수 있는 다양한 위험 시나리오에 대한 대응력을 점검할 계획이다.
이번 챌린지에는 약 100명의 참가자가 '레드팀' 역할로 참여해 프롬프트 설계만으로 AI의 취약점을 찾아내는 방식으로 진행된다. 기술적 해킹이 아닌 대화·프롬프트 기반 공격을 통해 AI의 정책과 안전장치를 우회할 수 있는지를 검증하는 것이 특징이다.
참가자들은 ▲ 안전장치 우회 ▲ 편향·차별 ▲ 인권 침해 ▲ 사이버 공격 ▲ 불법 콘텐츠 ▲ 허위 정보 ▲ 응답 비일관성 등 7개 항목에서 AI의 대응 수준을 평가한다.
이혜진 LG유플러스 기술전략담당은 "글로벌 AI 레드팀 챌린지 참여를 통해 익시젠의 경쟁력을 한층 강화하고, 고객이 안심하고 사용할 수 있는 AI 서비스를 제공해 나가겠다"고 말했다.
binzz@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>