快科技资讯 02月26日
阿里万相视频生成大模型重磅开源!消费级显卡也能运行
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里云深夜开源万相2.1视频生成大模型,采用Apache2.0协议,包含14B和1.3B两个参数规格的全部推理代码和权重,支持文生视频和图生视频。14B版本在Vbench评测中超越Sora等国内外模型,位居榜首。1.3B版本可在消费级显卡运行,适用于二次开发和学术研究。阿里云自2023年开始坚定大模型开源路线,千问衍生模型数量已超10万个。万相2.1通过自研架构增强时空建模能力,支持无限长1080P视频编解码,首次实现中文文字视频生成。开源已成大模型领域“标配”,各厂商纷纷推出自家的开源模型。

🚀阿里云开源万相2.1视频生成大模型,包含14B和1.3B两个参数规格,支持文生视频和图生视频任务,开发者可在Github等平台下载体验。

🏆14B版本万相模型在Vbench评测集中以86.22%的总分超越Sora、Luma、Pika等模型,稳居榜首,表明其在指令遵循、复杂运动生成等方面的卓越性能。

💻1.3B版本万相模型能在消费级显卡运行,仅需8.2GB显存即可生成480P视频,适用于二次模型开发和学术研究,降低了使用门槛。

🌐阿里云坚定大模型开源路线,千问衍生模型数量已超过10万个,成为全球最大的AI模型家族,万相的开源进一步完善了阿里云的全模态、全尺寸大模型开源布局。

快科技2月26日消息,25日深夜,阿里云视频生成大模型万相2.1(Wan)重磅开源。

此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace、魔搭社区下载体验。

据介绍,14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。

1.3B版本万相模型不仅超过了更大尺寸的开源模型,甚至还和一些闭源的模型结果接近,同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。

官方表示,从2023年开始,阿里云就坚定大模型开源路线,千问(Qwen)衍生模型数量已超过10万个,是全球最大的AI模型家族。

在视频生成方面,万相2.1通过自研高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能。

随着万相的开源,阿里云两大基模全部开源,实现了全模态、全尺寸大模型的开源。

自2025年1月DeepSeek爆火以来,开源已经逐渐成为国内外大模型领域的“标配”。

进入2月,字节豆包、昆仑万维、百度文心、阿里通义千问等纷纷推出自家的开源模型,加入这场开源热潮。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

阿里云 万相2.1 视频生成 大模型开源 人工智能
相关文章