传媒行业周报:阿里发布开源多模态模型Qwen2-VL,多项性能超越GPT-4o
- 2024-09-02 02:50:16上传人:lo**l!
-
Aa 小 中 大
摘要:阿里发布开源多模态模型Qwen2-VL,支持实时视频对话。8月30日,阿里通义千问宣布开源第二代视觉语言模型Qwen2-VL,推出2B、7B两个尺寸及其量化版本模型。Qwen2-VL在多个权威测评中创造了同等规模开源模型的优异成绩,能够识别不同分辨率和长宽比的图片,理解20分钟以上长视频,还具备自主操作手机和机器人的视觉智能
报告网所有机构报告是由用户上传分享,未经用户书面授权,请勿作商用!