6月30日,一个本来以为只是个普普通通上班🐟的日子,却被百度整得热热闹闹。
原来,百度兑现了之前2月份立下的flag,正式宣布:文心大模型4.5系列,开源了!并且一口气开源了10款模型。
说实话,我最开始用的大模型,就是百度的“搜索AI小伙伴”,后面出了“文心一言”,我也用了一段时间。再后来出了更多好用的模型,百度也就慢慢淡出了我的视野。
没想到百度这段时间也是没闲着,搁这憋大招呢。
(下面是我的收藏夹截图)
模型有哪些?全家桶直接安排!
百度这次放出的,是一个模型“十连包”,包括:
- 参数量从 0.3B稠密模型,到 **47B激活参数的混合专家(MoE)**模型;还有视觉+文本混合的多模态模型,不光能“读文”,还能“看图说话”。
这一整套模型,不只是丢个权重文件完事,而是预训练权重 + 推理代码双全,还同步上线了 API 服务,想撸代码的撸代码,想调 API 的调 API,门槛也是基本拉到了地板。
真开源,还是“假开源”?
如果你和我一样,常年混迹大模型圈子,那你肯定知道,开源的并不一定都是好模型,毕竟谁家还没个开源的大模型呢?做做样子谁不会?
所以开源的重点是 开得诚不诚,源得深不深。百度这次开源文心 4.5 系列,至少做到以下几点:
- 模型种类多:MoE、多模态、稠密模型,通通安排;技术够深:引入了自研的多模态混合专家架构,SOTA 基准测试成绩也摆出来了;协议够松:Apache 2.0,放心用,能商用;工具够全:搭配开源部署工具 FastDeploy 和开发套件 ERNIEKit,给开发者提供一整套“管饱”的工具链。
和友商比,怎么样?
接下来是你最关心的:那和别的模型比,开源的文心 4.5 到底怎么样?
来,掏出数据说话。
文心4.5预训练模型在主流基准测试中的表现
文心4.5-300B-A47B模型在主流基准测试中的表现
文心多模态后训练模型(支持思考、关闭思考)在多个多模态基准测试中达到SOTA水平
从数据中,可以看出,在文本任务方面:
- 文心4.5的主力选手,在多个基准测试中超越了 DeepSeek-V3、Qwen3、GPT4.1 等同量级模型;在推理、编程、事实准确性上表现尤为优秀,指令遵循能力也很能打。
在多模态任务方面:
- 文心4.5-VL多模态模型和视觉界的卷王 Qwen2.5-VL-32B 正面对线,不输甚至持平;视觉常识、多模态推理测试成绩上,比 OpenAI o1 还强一丢丢;还能“关掉思考模式”再测试,支持思考/不思考双形态评估。
总结下来就是:无论读图识字,还是写代码答题,文心4.5 确实都做的挺不错的。
听说罗永浩带货的数字人,就是用百度文心大模型生成的,不知道这次开源的内容里,是否也可以生成罗永浩同款数字人?有懂的朋友可以在评论区给大家分享一下。
这波开源,真香!
百度文心4.5系列这波开源,也算是国内大模型领域又一次重量级出击。前有 阿里千问、DeepSeek,现有百度文心,在开源模型这一块,国内确实做到了全球顶尖,很有实力了。
如果你是下面这些人群,那百度文心4.5系列真的非常推荐你去试试:
- 想做中文大模型项目的工程师想搭建多模态问答系统的开发者想薅开源羊毛、白嫖一波商用许可的企业用户
对了,我刚去 HuggingFace 上看了百度的模型,刚发布没多久呢,老新鲜了,赶紧冲就完事了!HuggingFace链接:huggingface.co/baidu/model…
也可以到飞桨AI Studio官方社区,在线体验:aistudio.baidu.com/overview