Cnbeta 8小时前
月之暗面发布首个自主强化学习Agent 性能超OpenAI、Gemini
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

月之暗面推出的首款Agent产品Kimi-Researcher,是一款基于端到端自主强化学习技术打造的智能研究助手。该产品在HLE测试中表现出色,超越了Claude 4 Opus、Gemini 2.5 Pro等模型,展现出强大的自主研究能力。Kimi-Researcher无需复杂提示词或预设流程,能够独立规划任务流程并交付完整结果,整合多源数据,并支持每条引用的直接追溯,有效减少幻觉问题。月之暗面计划逐步开源其基础预训练模型及强化学习优化版本,推动Agent强化学习领域的发展。

💡 Kimi-Researcher基于端到端自主强化学习技术,是一款高度自主的智能研究助手。它能够独立规划任务流程并交付完整结果,无需复杂提示词或预设流程。

✨ 在HLE测试中,Kimi-Researcher的性能超越了Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平,表现优异。

⚙️ 与其他Agent不同,Kimi-Researcher采用零结构设计,完全依靠自主决策能力在动态环境中运行。它能自行判断信息冲突时的权衡策略、任务节点的切换时机,以及中间信息的取舍标准,其核心驱动力是任务的实际解决效果。

📚 Kimi-Researcher整合多源数据,并支持每条引用的直接追溯,确保研究严谨性,有效减少幻觉问题。

🚀 月之暗面计划逐步开源Kimi-Researcher的基础预训练模型及强化学习优化版本,以推动Agent强化学习领域的探索与发展。

月之暗面(Moonshot AI)正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。该产品基于端到端自主强化学习(end-to-end agentic RL)技术打造,在HLE测试中表现优异,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平。

Kimi-Researcher 是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不同,它采用零结构设计,无需复杂提示词或预设流程,完全依靠自主决策能力在动态环境中运行。

例如,它能自行判断信息冲突时的权衡策略、任务节点的切换时机,以及中间信息的取舍标准,其核心驱动力始终是任务的实际解决效果。

作为一款深度研究模型,Kimi-Researcher 整合了多源数据,并支持每条引用的直接追溯,确保研究严谨性,有效减少幻觉问题。月之暗面表示,未来将逐步开源Kimi-Researcher 的基础预训练模型及强化学习优化版本,以推动Agent强化学习领域的探索与发展。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Kimi-Researcher 月之暗面 Agent 人工智能 深度研究
相关文章