性能超OpenAI、Gemini！月之暗面发布首个自主强化学习Agent

快科技资讯 6小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

月之暗面推出首款Agent产品Kimi-Researcher，一款高度自主的智能研究助手，基于端到端自主强化学习技术。该产品在HLE测试中表现出色，性能超越多个知名模型，并与Gemini-Pro的Deep Research Agent持平。Kimi-Researcher无需复杂提示词或预设流程，能独立规划任务流程并交付完整结果，整合多源数据并支持引用追溯，有效减少幻觉问题。月之暗面计划逐步开源其基础模型，推动Agent强化学习领域发展。

💡Kimi-Researcher基于端到端自主强化学习技术，是一款高度自主的智能研究助手，能够独立规划任务流程并交付完整结果。

🥇在HLE测试中，Kimi-Researcher的性能超越了Claude 4 Opus、Gemini 2.5 Pro以及OpenAI Deep Research，并与Gemini-Pro的Deep Research Agent持平。

⚙️Kimi-Researcher采用零结构设计，无需复杂提示词或预设流程，完全依靠自主决策能力在动态环境中运行，例如自行判断信息冲突时的权衡策略、任务节点的切换时机以及中间信息的取舍标准。

📚作为深度研究模型，Kimi-Researcher整合了多源数据，并支持每条引用的直接追溯，以确保研究严谨性，有效减少幻觉问题。

🚀月之暗面计划逐步开源Kimi-Researcher的基础预训练模型及强化学习优化版本，旨在推动Agent强化学习领域的探索与发展。

快科技6月23日消息，据媒体报道，月之暗面（Moonshot AI）正式推出其首款Agent产品——Kimi-Researcher（深度研究），并已启动小范围灰度测试。

该产品基于端到端自主强化学习（end-to-end agentic RL）技术打造，在HLE测试中表现优异，性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research，并与Gemini-Pro的Deep Research Agent持平。

Kimi-Researcher 是一款高度自主的智能研究助手，能够独立规划任务流程并交付完整结果。与其他Agent不同，它采用零结构设计，无需复杂提示词或预设流程，完全依靠自主决策能力在动态环境中运行。

例如，它能自行判断信息冲突时的权衡策略、任务节点的切换时机，以及中间信息的取舍标准，其核心驱动力始终是任务的实际解决效果。

作为一款深度研究模型，Kimi-Researcher 整合了多源数据，并支持每条引用的直接追溯，确保研究严谨性，有效减少幻觉问题。月之暗面表示，未来将逐步开源Kimi-Researcher 的基础预训练模型及强化学习优化版本，以推动Agent强化学习领域的探索与发展。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签