AI 领域的硝烟真是愈演愈烈,自 deepseek 宣布开源以来,陆续有多个国内大模型进行开源,早在2025年2月份,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源,“当时只道是寻常”,没有体会到百度官方此言的的威力以及百度蓬勃的 AI 野心。
6月30日,百度兑现承诺,宣布文心大模型 4.5 全面开源,一下子开源了10个模型,你说这扯不扯,10个,没错,就是 10 个。细观此次开源,百度展现出了满满的诚意和强大的 AI 技术能力,AI 世界,你永远不知道明天会发生什么。
文心4.5系列全部模型(包括预训练权重和推理代码)和项目均已完全开源至 Hugging Face(huggingface.co/baidu)、GitH… yiyan.baidu.com/blog/public…
总结来看,文心大模型 4.5 开源有以下亮点:
亮点1: 开源盛举-10款大模型宣布开源
百度文心大模型 4.5 系列开源绝非 Ordinary 的举措,而是一次充满诚意与雄心的技术共享盛宴。本次开源的模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,构建了覆盖企业级应用到终端部署的完整技术体系。
亮点2: 双层开源 + 全栈技术,树立行业新标杆
本次开源模型预训练权重和推理代码完全开源,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度行业领先,且与业界单一模型开源不同,百度此次实现了 "飞桨框架 3.0 + 文心模型 4.5" 的双层开源架构,形成从底层算力到上层应用的全链路赋能体系,为AI行业的发展树立了新标杆。
亮点3: 创新性的多模态异构模型结构
针对 MoE 架构,我们提出了一种创新性的多模态异构模型结构,通过跨模态参数共享机制实现模态间知识融合,同时为各单一模态保留专用参数空间。此架构适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力,其优越的性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后训练等关键技术点。
亮点4: 性能卓越,傲视群雄
文心 4.5 系列开源模型在性能表现上堪称惊艳,经过一系列权威评测的严苛检验,均展现出卓越的性能。
- 在文本模型方面,文心4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越DeepSeek-V3、Qwen3。多模态模型方面,文心 4.5 开源系列更是凭借其非凡的视觉感知能力和对丰富视觉常识的精通,以及独特的思考与非思考统一架构,在视觉常识理解、多模态推理以及视觉感知等关键多模态大模型评测中,一举超越了闭源的 OpenAI o1,成为多模态领域的佼佼者。。在轻量模型上,文心 4.5 也是毫不逊色。文心 4.5-21B-A3B-Base 文本模型与同量级的 Qwen3 相当,而文心 4.5-VL-28B-A3B 多模态模型更是同量级中最佳的开源多模态模型,甚至与更大参数的 Qwen2.5-VL-32B 相比也毫不逊色,真正实现了 “以小博大”。
亮点5: 应用场景多元,赋能千行百业
文心 4.5 系列开源模型的强大能力,为众多行业带来了前所未有的机遇。在数字人领域,基于文心多模态大模型的高说服力数字人,已经展现出惊人的商业价值。例如近期火爆出圈的罗永浩数字人,在电商直播首秀中便创下了超 1300 万人次观看、GMV 突破 5500 万元的行业新纪录,部分核心品类带货量甚至反超真人直播。
此外,百度多个AI应用产品已基于文心4.5,进行了功能升级。如文心快码发布独立IDE,为行业首个多模态、多智能体协同AI IDE;文小言升级多模型调度、图片问答等能力等。
文心4.5系列开源后,百度AI应用规模化落地也将进一步加速。近期李彦宏表示,开源有助于扩大新技术的采用率,他强调无论开源、闭源,基础模型只有解决现实问题,才具备真实价值。