코스피

2,538.18

  • 36.94
  • 1.48%
코스닥

698.35

  • 21.34
  • 3.15%
1/3

트웰브랩스, '페가수스'·'마렝고' 업데이트 버전 출시

페이스북 노출 0

핀(구독)!


글자 크기 설정

번역-

G언어 선택

  • 한국어
  • 영어
  • 일본어
  • 중국어(간체)
  • 중국어(번체)
  • 베트남어
트웰브랩스, '페가수스'·'마렝고' 업데이트 버전 출시
"제미나이1.5프로·GPT-4V와 견줘 최대 43% 성능 우위"



(서울=연합뉴스) 홍국기 기자 = 영상 이해 초거대 인공지능(AI) 개발 기업 트웰브랩스(TwelveLabs)는 영상 언어 생성 모델 '페가수스'(Pegasus-1)와 복합정보처리(멀티모달) 영상 이해 모델 '마렝고'(Marengo 2.6)를 업데이트했다고 14일 밝혔다.
페가수스는 지난해 11월 처음 공개돼 영상에 대한 요약, 하이라이트 생성 등 영상 기반 텍스트 생성 기능들을 최초로 선보인 초거대 AI 영상 언어 생성 모델이다.
이번 업데이트로 영상에 관해 궁금한 점들을 질문하면 답을 해주는 영상 질의응답 성능이 대폭 향상됐다.
또 기존 모델은 홈페이지 내 대기자 명단 등록을 통해서만 사용할 수 있었지만, 이번 업데이트 모델부터는 일반 대중에 공개돼 누구나 접근·활용할 수 있다.
유료 버전의 경우 대량의 영상 활용이 필요한 기업과 개발자들에게 합리적인 가격으로 제공된다고 트웰브랩스는 소개했다.
작년 4월 출시돼 현재 시범 운영 중인 마렝고는 영상, 이미지, 음성 기반의 멀티모달 모델로 기존 다른 모델과 견줘 행동이나 방향성 등을 인지하는 '모션 이해'(Motion Understanding) 인지 기능을 대폭 강화한 것이 특징이다.
트웰브랩스는 업데이트 버전의 페가수스와 마렝고 모델이 구글의 제미나이 1.5 프로, 오픈AI의 GPT-4V 등의 상용·오픈소스 영상 언어 모델과 비교해 최대 43%가량의 성능 우위를 보였다고 강조했다.
특히 분 단위의 짧은 영상들만을 처리할 수 있는 다른 모델과 달리, 수백 시간의 영상들을 실시간으로 처리할 수 있어 인프라 완성도 측면에서도 크게 앞선다고 회사는 설명했다.
트웰브랩스 이재성 대표는 "페가수스·마렝고는 영상 언어 초거대 모델들로는 수행이 불가능한 세밀한 수준의 작업까지 지원한다"며 "영상 이해 기술을 핵심 산업에 최적화해 본격적인 확산을 추진하겠다"고 말했다.
트웰브랩스는 멀티모달 신경망 기술을 바탕으로 글로벌 AI 영상 시장에서 오픈AI, 구글 등과 어깨를 나란히 하는 토종 스타트업이다.
지난해 CB인사이트와 비즈니스인사이더로부터 각각 '세계 50대 AI 기업'과 '최고 유망 AI 스타트업'으로 선정됐으며 엔비디아, 인텔, 삼성넥스트, 한국투자파트너스 등으로부터 1천만 달러(한화 약 140억 원) 규모의 전략적 투자를 유치한 바 있다.

redflag@yna.co.kr
(끝)


<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
- 염색되는 샴푸, 대나무수 화장품 뜬다

실시간 관련뉴스