카카오브레인은 입력한 제시어를 바탕으로 고품질의 이미지를 빠르게 만들어내는 AI 아티스트 ‘칼로 1.0’ 모델을 세계 최대 오픈소스 커뮤니티 깃허브에 공개했다고 1일 밝혔다.
‘칼로’는 카카오브레인이 공개한 ‘민달리(minDALL-E)’, ‘RQ-트랜스포머(RQ-Transformer)’ 등 초거대 이미지 생성 AI 모델을 발전시켜 하나의 페르소나로 재탄생한 AI 아티스트다.
1.2억 장 규모의 텍스트-이미지 데이터셋을 학습해 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 세상에 단 하나뿐인 이미지를 생성할 수 있다.
AI 아티스트 ‘칼로’는 교육·발표 준비에 필요한 시각 자료 제작은 물론 신규 브랜드 로고 디자인과 구조물 디자인 등 고도의 창의성을 요하는 산업군에서 영감을 주는 예술 도구로 활용할 수도 있다.
카카오브레인은 내년 초 개선된 품질과 기능이 추가된 ‘칼로’ 모델을 오픈 API 형태로 공개하며 사용자의 접근성을 높여갈 예정이다.
또한 지속적으로 텍스트-이미지 데이터셋 추가 학습을 진행하는 한편, 이미지에서 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 ‘이미지 인페인팅’, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅’ 등 다양한 기능을 추가하며 모델의 성능을 고도화해 나갈 계획이다.
카카오브레인 김일두 대표는 “이번에 공개한 칼로 모델로 AI 아티스트의 무궁무진한 가능성을 다방면에 활용할 수 있을 것”이라며 “앞으로도 카카오브레인은 세계적 수준의 AI 모델들을 오픈소스로 공개하며 AI 생태계 발전 가속화에 힘을 보탤 것”이라고 말했다.
한편, 카카오브레인은 지난 10월 AI 아티스트 ‘칼로’를 활용해 국내 최초 AI 이미지 생성 앱 ‘B^ DISCOVER’를 글로벌 시장에 무료 공개했다. 예술가들의 창작 활동을 지원하는 전문가용 버전은 내년 초 공개를 앞두고 있다.