알리바바는 24일(현지시간) 기술 리더십을 위한 글로벌 경쟁이 가열됨에 따라 이미지를 이해하고 회사의 이전 제품보다 더 복잡한 대화를 수행할 수 있는 새로운 인공 지능 모델을 출시했다고 밝혔다.
중국 기술 대기업은 자사의 두 가지 새로운 모델인 Qwen-VL과 Qwen-VL-Chat이 오픈 소스가 될 것이라고 말했다.
또한 전 세계의 연구원, 학계 및 기업이 자체 시스템을 교육할 필요 없이 이를 사용해 자체 AI 앱을 만들 수 있고 시간과 비용을 절약할 수 있다고 설명했다.
알리바바는 Qwen-VL이 다양한 이미지와 관련된 개방형 쿼리에 응답하고 사진 캡션을 생성할 수 있다고 했다.
Qwen-VL-Chat은 여러 이미지 입력을 비교하고 여러 차례의 질문에 답하는 것과 같은 더 복잡한 상호 작용에 초점을 맞추고 있다.
Qwen-VL-Chat이 수행할 수 있는 일부 작업에는 사용자가 입력한 사진을 기반으로 한 스토리 작성, 이미지 생성, 사진에 표시된 수학 방정식 풀기 등이 포함된다.
알리바바의 두 가지 최신 모델은 올해 초 출시된 Tongyi Qianwen이라는 회사의 대규모 언어 모델을 기반으로 구축됐다.