钛媒体:引领未来商业与生活新知 10小时前
刚刚!智谱开源3550亿参数GLM-4.5模型,多项性能或超越Kimi K2成全球第三
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智谱于7月28日全球发布新一代旗舰模型GLM-4.5系列,该系列专为AI Agent智能体应用打造,采用混合专家(MoE)架构,在推理、代码及智能体综合能力上达到开源模型SOTA水平。GLM-4.5系列在多项评测中表现突出,综合平均分位列全球第三、国产模型第一、开源模型第一,其参数效率和API价格均具备显著优势。此次发布包括总参数量3550亿的GLM-4.5和1060亿参数的GLM-4.5-Air,两者均已在Hugging Face和ModelScope平台开源,并提供API服务。智谱CEO张鹏强调AGI能力需全面性,并表示公司将持续聚焦行业Agent产品、解决方案及MaaS服务。目前,GLM-4.5已向公众免费开放体验,标志着国内大模型在开源领域迈出了重要一步。

🌟 **GLM-4.5系列性能领先,多项指标达SOTA水平**:智谱最新发布的GLM-4.5系列模型,专为AI Agent智能体应用设计,采用混合专家(MoE)架构。在通用能力、代码生成和智能体综合表现上,GLM-4.5系列达到了开源模型的顶尖水平(SOTA)。具体评测数据显示,其综合平均分位列全球模型第三、国产模型第一、开源模型第一,多项评分超越了DeepSeek-R1-0528和Kimi K2等知名模型,展现了强大的技术实力。

🚀 **模型参数高效,成本效益显著**:GLM-4.5系列在参数量上具有更高的效率。例如,GLM-4.5的参数量仅为DeepSeek-R1的50%、Kimi-K2的三分之一,但在多项基准测试中表现更优。此外,其API价格极具竞争力,输入每百万tokens仅需0.8元,输出每百万tokens为2元,相当于Claude的1/10。高速版本实测生成速度超过100 tokens/秒,支持低延迟、高并发的部署需求,兼顾了成本和用户体验。

🌐 **全面开源与广泛应用,推动AI普惠**:智谱此次将GLM-4.5和GLM-4.5-Air两款模型全面开源,并同步上线Hugging Face和ModelScope魔搭平台,同时API已在智谱开放平台上线。这使得开发者和企业能够更便捷地获取和使用高性能大模型,加速AI技术的落地和创新。公司CEO张鹏也强调了AGI能力需要全面性,并表示智谱将持续向企业提供MaaS服务,推动大模型在金融、医疗、教育等多个行业的规模化应用。

📈 **商业化进展稳健,融资支持持续**:智谱在商业化方面也取得了显著进展。截至2023年底,已拥有超2000家生态合作伙伴和超1000个大模型规模化应用,并有200多家企业进行深度共创。在C端市场,智谱清言用户已超2500万,并开始上线付费功能,年度经常性收入(ARR)超千万元。近期,智谱获得了上海国资10亿元的战略融资,累计融资超百亿元,估值超过200亿元,显示出资本市场对智谱发展的高度认可和支持。

国内大模型赛道太“卷”了。

Kimi K2、MiniMax M2、阶跃星辰Step-3模型发布不到一个月,这次智谱又要发布最强新模型了。

7月28日消息,刚刚,智谱在全球发布新一代旗舰模型GLM-4.5系列,这是专为 AI Agent智能体应用打造的基础模型,采用混合专家(MoE)架构,在推理、代码、智能体综合能力达到开源模型SOTA水平。综合平均分,GLM-4.5 取得了全球模型、国产模型,开源模型第一,多项评分超越DeepSeek-R1-0528(55.9)和Kimi K2(53.1)等多款模型。

此次GLM-4.5系列包括两款产品:总参数量3550亿、激活参数320亿的GLM-4.5,以及1060亿参数的GLM-4.5-Air。目前,GLM-4.5和 GLM-4.5-Air已经全面在Hugging Face与ModelScope魔搭平台同步开源,API已上线智谱开放平台,满血版GLM-4.5已经可以在智谱清言、z.ai官网免费体验。

智谱CEO张鹏早前对笔者表示,智谱依然坚持在做行业Agent产品和解决方案,以及向企业提供MaaS服务。同时,AGI需模型能力的全面性,人类处理复杂任务时,会面对多模态与复杂交互情况,如同木桶不能有短板,对能力需求是全面性的。

“不可否认的是,当下AGI之路还刚刚开始,(当前)模型的能力还无法达到完全类比人的这样一个水平。”张鹏曾坦言。

智谱GLM-4.5评测数据信息

据悉,智谱成立于2019年,以“让机器像人一样思考”为愿景,研发了具有国产独立知识产权的GLM大模型预训练架构。自2023年3月智谱 AI 推出千亿开源基座对话模型ChatGLM系列以来,GLM大模型经历四个大版本迭代,共发布了超过20款 AI 模型技术和产品。

商业化方面,截至2023年底,智谱已拥有超2000家生态合作伙伴、超1000个大模型规模化应用,另有200多家企业跟智谱AI进行了深度共创,智谱GLM系列大模型已在金融、医疗、教育等多个行业得到广泛应用;C端层面,截至2024年底,智谱清言拥有超过2500万用户,开始上线付费功能,ARR(年度经常性收入)收入超千万元。

融资方面,今年7月,在冲击IPO上市关口,智谱宣布获得上海国资10亿元战略融资;在此之前,智谱获得杭州城投产业基金、上城资本、珠海华发集团、四川成都高新区等机构的融资。据统计,截至目前,智谱累计融资超百亿元,投后估值超过200亿元,投资方包括高瓴、启明创投、君联资本等知名投资机构,以及美团、阿里、腾讯、小米在内的互联网公司。

智谱曾表示,2025年将是智谱的开源年,其将很快发布包括基座模型、推理模型、多模态模型、Agent等在内的全新大模型,并将其开源。

如今,智谱终于实现开源最强模型这一目标,这得益于GLM模型的更高参数效率和强化训练流程等多种技术能力。

首先,据介绍,而GLM-4.5和GLM-4.5-Air使用了相似的训练流程,首先在 15 万亿token的通用数据上进行了预训练,此后在代码、推理、智能体等领域的8万亿token数据上进行针对性训练,最后通过强化学习进一步增强模型推理、代码与智能体能力。

其次,GLM-4.5参数量仅为DeepSeek-R1的50%、Kimi-K2的三分之一,但在多项标准基准测试中表现得更为出色。而且,API价格仅为Claude的1/10,低至输入每百万tokens达0.8元,输出每百万tokens达2元。同时,高速版本实测生成速度超过 100 tokens/秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。

最后,评测层面,GLM-4.5分为基准和真实场景表现。其中,在包括 MMLU Pro等12个评测基准中GLM-4.5取得了优异成绩,全球模型第一是OpenAI o3(65.0)、第二是xAI Grok 4(63.6)、第三是GLM-4.5(63.2),超越了Kimi K2(53.1)、DeepSeek R1(55.9);真实评测方面,采用52个编程开发任务当中,GLM-4.5相对其他开源模型展现出竞争优势,虽然略逊于Claude-4-Sonnet,但在工具调用可靠性和任务完成度方面表现突出,大部分场景中可实现平替效果,编写较为复杂的应用、游戏、交互网页等。

目前,GLM-4.5已经对外开源。智谱称,公司后续会发布更加详细的技术报告。

事实上,除了智谱GLM-4.5之外,今晚阿里又发布了新的开源模型——电影级视频生成模型通义万相Wan2.2,可将光影、色彩、镜头语言三大电影美学元素装进模型,随意组合60多个直观可控的参数,大幅提升电影级画面的制作效率;而上周,阿里AI三连发——Qwen 3最新版基础模型(非思考版)、Qwen 3推理模型和AI编程模型Qwen3-Coder,它们分别在基础模型、推理模型和编程模型等主流领域获得全球开源冠军;阶跃星辰则在WAIC期间发布Step 3模型,是公司首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,采用 MoE 架构,总参数量3210亿,激活参数量380亿。

据悉,OpenAI也即将释放最强闭源模型GPT-5,预计最快在7月底发布,有望支持Sora 2世界模型,从而实现多模理解一体化。

一位AI行业人士7月28日向笔者表示,随着中国大模型越来越开源,硅谷模型转向闭源,而国内模型的开源对于AI行业有更多的益处。这也意味着,全球基础大模型行业有望迎来新的“洗牌”。

(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

智谱 GLM-4.5 大模型 AI Agent 开源模型
相关文章