IT之家 23小时前
Kimi-Researcher 深度研究模型开启内测:可生成易追溯的万字报告
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

月之暗面推出的Kimi-Researcher是一款基于端到端自主强化学习技术训练的Agent模型,专注于深度研究任务。该模型能够自主规划任务流程,进行多步推理,主动搜索信息,调用工具处理数据,最终交付详尽的深度研究报告和动态可视化报告。在Humanity's Last Exam(HLE)和xbench基准测试中,Kimi-Researcher表现出色,展现了其在深度研究领域的强大能力,并将在未来逐步开源。

🔍 Kimi-Researcher 是一款专为深度研究任务设计的Agent产品,它基于端到端自主强化学习技术,能够自主规划任务执行流程。

🤔 在解决问题时,Kimi-Researcher平均进行23步推理,自主梳理并解决需求,并且会主动反问,构建更清晰的问题空间。

🌐 Kimi-Researcher 具备主动搜索能力,平均规划74个关键词,找到206个网址,筛选信息质量最高的内容。它还会调用浏览器、代码等工具,处理原始数据、自动生成分析结论。

📊 用户将收到两份交付成果:一份是信息详实、可溯源的深度研究报告,平均长度超过万字,包含约26个高质量信源;另一份是可交互、可分享的动态可视化报告,支持在线分享。

🏆 Kimi-Researcher 在Humanity's Last Exam(HLE)中表现出色,Pass@1准确率达到26.9%,超过了Claude 4 Opus和Gemini 2.5 Pro。在红杉中国发布的xbench基准测试中,Kimi-Researcher 在DeepSearch任务中取得69%的平均通过率。

IT之家 6 月 21 日消息,IT之家从月之暗面 Kimi 公众号获悉,Kimi 的第一个 Agent(智能体)Kimi-Researcher 于 20 日开启小范围灰度测试

Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。其后,月之暗面也将逐步开源 Kimi-Researcher 基础预训练模型及强化学习后的模型。

对于每一个问题,Kimi-Researcher 都会自主规划任务执行流程,最终交付完整结果:

为了保证输出的质量和信息覆盖度,Kimi-Researcher 采用异步执行方式,用更多时间逐步推理、检索和撰写内容。

用户最终将收到 2 个交付成果。

一份信息详实、可溯源的深度研究报告

一个可交互、可分享的动态可视化报告

官方宣布,在专为 AI 设计的高难度 benchmark“人类最后一次考试(Humanity's Last Exam,HLE)”中,Kimi-Researcher 在完全零结构、无流程设计的设置下,得分如下:

这一表现超过了 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),和 Gemini-Pro 的 Deep Research Agent(26.9%)打平,是目前已知最高水平之一。在红杉中国发布的 xbench 基准测试中 —— 一套对齐真实任务场景的 AI 能力评估体系,Kimi-Researcher 在 DeepSearch 任务中取得 69% 的平均通过率,领先该榜中其他模型。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Kimi Agent 深度研究 人工智能 月之暗面
相关文章