IT之家 07月10日 15:23
扩散语言模型写代码,速度比自回归快 10 倍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Inception Labs 推出的 Mercury 是一款基于扩散技术的商业级大语言模型,专为代码生成设计。它颠覆了传统自回归模型的逐词生成方式,通过并行预测所有 token,实现了比传统模型快 10 倍的代码生成速度。Mercury 具备动态纠错能力,并结合 Transformer 架构,充分利用现有的优化技术。实测显示,Mercury 在 H100 GPU 上的吞吐量高达 1109 tokens/秒,且能有效解决超快代码生成速度与现有 CI 能力不匹配的问题,从而显著缩短了开发周期。

🚀 Mercury 采用了基于扩散技术的“从噪声到结构化输出”的生成方式,突破了自回归模型逐词生成的限制,实现了并行预测,从而提高了代码生成速度。

⚙️ Mercury 保留了 Transformer 架构,可以直接复用大语言模型的高效训练和推理优化技术,如低阶算子优化、超参数调优等,确保模型性能。

💡 Mercury 具备强大的错误纠正能力,能够在生成过程中动态修改已生成内容,并通过双向注意力机制和实时纠错模块提高代码准确性。

⚡ Mercury 通过并行化文本生成、动态去噪调度和混合精度量化等技术,高效利用 GPU 资源,在 H100 GPU 上实现了 1109 tokens/秒的吞吐量,并且降低了推理成本。

🤔 Mercury 团队由来自斯坦福、UCLA 和康奈尔大学的计算机教授组成,其中 Stefano Ermon 是扩散模型的共同发明人,团队成员还包括来自 Google DeepMind、微软、Meta、OpenAI 和 NVIDIA 的资深人士。

谁说扩散模型只能生成图像和视频?

现在它们能高质量地写代码了,速度还比传统大模型更快!

Inception Labs 推出基于扩散技术的全新商业级大语言模型 ——Mercury

Mercury 突破了自回归模型“从左到右”逐词生成的限制,采用“从噪声到结构化输出”的方式,能一次性预测所有方向的 token,提高了生成速度。

这样一来,Mercury 还解决了自回归“一旦生成难以回头调整”的问题。

扩散模型并不是仅考虑前面已经生成的内容,它能在生成过程中进行动态纠错修改,具有更大的灵活性。

尽管采用了扩散技术,Mercury 模型系列仍保留了 Transformer 架构。

这确保了该模型能直接复用近年来为大语言模型开发的高效训练、推理优化技术(如低阶算子优化、超参数调优工具等)。

实测数据显示,面对相同的编程任务,Mercury 的代码生成速度比传统工具最多快 10 倍,大幅缩短了开发周期。

在 H100 GPU 上实现 1109 tokens / 秒吞吐量

Mercury 用成熟的 Transformer 作为神经网络基础,结合扩散技术的并行生成能力,既保留了大模型的兼容性,又突破了自回归模型逐词生成的速度限制。

扩散生成流程

Mercury 的核心创新在于“扩散式生成”,流程如下:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Mercury 扩散模型 代码生成 大语言模型
相关文章