IT之家 03月28日 10:30
阿里通义千问推出视觉推理模型 QVQ-Max:可分析、推理图片和视频内容
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里通义千问团队推出QVQ-Max视觉推理模型,能理解图片和视频内容,进行分析推理,还可完成多种创作,在学习、工作、生活中都能发挥作用,目前已上线Qwen Chat。

🧐QVQ-Max对图片解析能力强,能快速识别关键元素

🤔不仅能识别,还能分析信息并结合知识得出结论

🎨能做设计插画、生成脚本等有趣的事,应用广泛

💼可协助工作中的数据分析等任务,是学习好帮手

IT之家 3 月 28 日消息,今天凌晨,阿里通义千问团队宣布推出新一代视觉推理模型 QVQ-Max。

据官方介绍,QVQ-Max 不仅能够理解图片和视频内容,还能为上述信息提供分析并推理。不止分析和推理,QVQ-Max 还可以完成设计插图、生成短视频剧本等内容,甚至根据用户的需求创建角色扮演内容。

核心能力:从观察到推理

QVQ-Max 的能力可以总结为三个方面:细致观察、深入推理和灵活应用。下面分别来说说它在这些方面的表现。

QVQ-Max 的应用范围很广,无论是在学习、工作还是日常生活中都能派上用场。

IT之家注意到,目前该模型已上线 Qwen Chat,用户只需上传任意图片或视频,提出问题,并点击“Thinking”按钮,即可使用 QVQ-Max 的推理能力。

阿里巴巴表示,这只是该模型演化过程中的一个阶段,未来还将持续优化其性能并扩展功能。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

QVQ-Max 视觉推理 阿里通义千问 智能应用
相关文章