규칙 나열식에서 판단기준 형식으로 개편

(샌프란시스코=연합뉴스) 권영전 특파원 = 오픈AI 경쟁사 앤트로픽이 자사 AI 모델 '클로드'의 행동 강령에 해당하는 '헌법'을 3년 만에 전면 개정했다.
앤트로픽은 2023년 공개한 '규칙' 나열식의 헌법을 폐기하고, '판단' 기준 형식의 새 헌법을 도입했다고 21일(현지시간) 밝혔다.
앤트로픽의 이전 헌법은 세계인권선언과 애플의 이용약관, 구글 딥마인드의 규칙 등을 참고해 작성한 것으로, '생명, 자유, 개인의 안전을 가장 지지하고 장려하는 답변을 하라'거나 '타인의 개인정보가 가장 적게 포함된 답변을 선택하라'와 같은 형식으로 원칙을 제시했다.
그러나 앤트로픽은 이와 같은 강제적 원칙이 실제 대화에 적용되면 예상치 못한 부작용이 나타날 수 있다는 사실을 알게 됐다고 설명했다.
예를 들어 '감정적 주제를 논의할 때는 항상 전문가의 도움을 권유하라'는 규칙을 강제 적용하면 챗봇이 실제 사람들을 돕기보다는 전문가의 도움을 받으라는 관료적 답변만 반복하게 될 수 있다는 것이다.
이에 앤트로픽은 ▲ 광범위한 안전 ▲ 광범위한 윤리 ▲ 규정 준수 ▲ 진정한 도움 등 4대 핵심 가치를 설정하고, 이들 가치가 필요한 이유를 서술하는 방식을 택했다.
만약 여러 가치 간에 충돌이 발생하면 클로드가 설정된 우선순위에 맞춰 판단할 수 있도록 했다.
다만 생물무기 개발 지원 등과 같이 오판의 여지가 없는 절대 불가 항목은 남겨뒀다.
앤트로픽은 앞으로도 헌법을 지속해 개정할 계획이라고 설명했다.
앤트로픽은 영리화에 비판적이었던 오픈AI 직원 출신들이 주축이 돼 지난 2021년 설립된 스타트업으로, 공익기업을 표방하고 있다.
comma@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
