原创 orangesai 2024-11-06 07:52 北京
腾讯把自家最好的大模型之一混元 Large 开源了
这是目前综合能力最强的开源大语言模型。
腾讯这次真的是把家底儿都掏出来了…
把自家最好的大模型之一混元 Large 开源了。
这就是元宝 AI 阅读、AI 搜索等腾讯自己产品里都在用的同款模型。
同时也是目前综合能力最强的开源MoE大语言模型。
模型特点:
389B 的 MoE 模型,激活参数 52B,256K 上下文,7T 训练量
免费,可商用
各项指标都非常好
代码能力非常强
腾讯 Large 和一些开源模型的指标对比,在技术报告中有更详尽的对比:
干货满满的技术报告:
腾讯不仅放出了自家的超强模型,还公开了干货满满的技术报告。
这个技术报告满足了我对很多前沿技术的好奇心,比如:
MoE 的 Scaling Law 有何特别之处
MoE 如何有效激活和训练每个专家的能力
合成数据的应用,如何对代码和数学能力提升超 10%
对开发 AI 应用和研究大语言模型技术都很有帮助,强烈建议收藏学习!
技术报告地址:
https://arxiv.org/abs/2411.02265
去哪里用腾讯混元 Large:
官网体验地址:
https://llm.hunyuan.tencent.com/
Github地址:
https://github.com/Tencent/Tencent-Hunyuan-Large
Hugging Face 地址:
https://huggingface.co/tencent/Tencent-Hunyuan-Large
全面拥抱开源的腾讯
官方的发布会上,腾讯说,这次的开源,其实只是第一步。
接下来,还会有混元-M和混元-S会陆续开源。
毕竟389B参数的混元 Large,在很多场景里,有点大材小用。
这些场景使用小模型更具性价比。
值得一提的是,今天除了混元 Large 之外,腾讯还放出了一个 3D 模型:混元 3D 1.0
这是业界首个同时支持文字、图像生成3D的开源大模型。
有了 3D 模型和拓竹 3D 打印机,未来轻松实现玩具自由…
上传一张照片——生成 3D 模型——3D 打印出来
这样你就拥有了自己的手办!
这两个开源模型已经很厉害了,在目前的生态里都是很有价值的模型。
但是算法小哥哥说,接下来还有几款重磅模型要陆续开源。
AI 开源社区表示大受震撼…
最后想说的话
今天的直播有一句话,让我印象特别深刻:
不要为了开源而开源,要开就要有诚意!
希望未来不管是大厂还是六小虎,
都能多一些诚意的开源,一起加速 AI 行业共同进步!