机器之心 02月05日
不到24小时,开源版Deep Research疯狂来袭!一月少花1400
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI发布了全新的智能体Deep Research,旨在帮助用户进行深入的信息查询与分析。然而,由于其Pro订阅用户限制和每月200美元的费用,许多开发者迅速推出了各种开源复现版本。这些项目包括Open Deep Research、OpenDeepResearcher和node-DeepResearch,它们分别利用爬虫工具、搜索功能和强化学习等技术,试图在不同程度上复制Deep Research的功能,为用户提供免费或更灵活的替代方案。这些开源项目在AI社区引起了广泛关注,并迅速获得了大量关注。

💡**Open Deep Research**: 作为一个AI智能体,它通过爬虫工具Firecrawl提取数据并结合推理模型,深入研究网络信息。该项目默认使用gpt-4o模型,并允许用户切换为Anthropic、Cohere等模型。

🔍**OpenDeepResearcher**: 作为一个开源的 AI 智能体,它能为用户提供全面的研究报告。用户只需提供主题,智能体将执行搜索、查看结果页面并提取信息,通过重复搜索和提问来深入了解,最终生成综合报告。

🌐**node-DeepResearch**: 由Jina AI CEO肖涵创建,该项目在nodejs环境中,利用谷歌gemini-flash和jina reader进行复现。它通过循环执行“搜索+读取+推理”步骤,实现信息查询功能,但缺少微调o3推理模型的支持。

2025-02-04 18:35 河南

OpenAI被开源包围了。

机器之心报道

机器之心编辑部

OpenAI 被开源包围了。


昨日,AI 社区最大的新闻当属 OpenAI 发布的全新智能体 Deep Research 了!


作为一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体,Deep Research 旨在帮助用户进行深入、复杂的信息查询与分析。


显然,对于那些在金融、科学、政策和工程等领域从事密集知识工作并需要彻底、精确和可靠研究的用户而言,Deep Research 称得上研究神器了。


项目负责人之一 Zhiqing Sun(孙之清)本科毕业于北京大学计算机科学与技术系。2019 年起在 CMU 语言技术研究所攻读博士学位,现为 OpenAI 研究科学家。


遗憾的是,Deep Research 目前仅供 Pro 订阅用户使用,每月 200 美元着实令很多人望而却步。


所以,在 Deep Research 发布之后,各种开源复现版本纷至沓来。


从 OpenAI 发布的官方博客来看,Deep Research 用到了端到端的强化学习,并且在多个领域的复杂浏览和推理任务上进行了训练,因此才有了现在的性能。


其实,早在去年,来自字节跳动 ByteDance Research 的研究人员就提出了基于强化学习(Reinforcement Learning, RL)的 LLM Agent 框架 ——AGILE。该研究已被NeurIPS接收,这应该是学术界第一个用强化学习做Agent的端到端训练的工作。了解更多内容可以参考机器之心此前报道《端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE》。


接下来,我们看看在一天之内,都有哪些 Deep Research开源复现项目。


一、Open Deep Research


其中一个开源复现版本为「Open Deep Research」。


项目地址:https://github.com/nickscamara/open-deep-research


具体而言,Open Deep Research 是一个 AI 智能体,可以对大量的 web 数据进行推理,该方法没有使用 o3 的微调版本,而是使用了爬虫工具 Firecrawl 的提取 + 搜索功能以及推理模型来深入研究网络。


项目主页还放出了 demo 展示,我们可以发现,在询问 Open Deep Research 关于「2025 年 B2B 领域最大的创业机会」时,Open Deep Research 给出了思考过程,答案也相当完美。


根据项目介绍,我们可以得知 Open Deep Research 背后默认的模型为 gpt-4o,如果你想换个其他模型使用也是可以的,只需几行代码即可切换为 Anthropic、Cohere 等发布的模型。


二、OpenDeepResearcher


另外一个比较热门的复现项目为「OpenDeepResearcher」。


项目地址:https://github.com/mshumer/OpenDeepResearcher


作为一个开源的 AI 智能体,OpenDeepResearcher 可以提供全面的研究。用户只需提供一个主题,该智能体就会展开研究,并返回一份综合报告。


其工作过程非常简单,对于给定的查询,OpenDeepResearcher 执行以下步骤:



三、node-DeepResearch


最后一个复现项目是「node-DeepResearch」,它是由 Jina AI CEO 肖涵(Han Xiao)创建。


他表示,OpenAI 的 Deep Research 只是在 while 循环中进行「搜索 + 读取 + 推理」。他在 nodejs 运行环境中,使用谷歌 gemini-flash 和 jina reader(Jina AI 推出的开源工具,将互联网上的 HTML 网页内容转换为适合 LLM 处理的纯文本格式)进行了复现。


我们来看下运行效果。


下面是「jina ai 最新博客文章内容是什么」(what is the latest blog post from jina ai)的 2/3 步搜索示例:首先找到 jina ai 新闻网站、阅读其内容,然后确定最新帖子内容。


下面视频是关于「who is the biggest, cohere, jina ai, voyage」的 13 步查询,经过搜索、反馈、循环之后,结果是正确的(cohere)。这里视频 2 倍加速。


对于 node-DeepResearch,显然缺少了微调 o3 推理模型的支持。


有人认为,这个项目实现了 OpenAI 准备了半年多的东西所做到的功能。还有人呼吁,赶紧把 UI 做得漂亮一点。


目前,该项目已经收获了近 700 个 Stars。


项目地址:https://github.com/jina-ai/node-DeepResearch


相信后续会有更多类似的开源智能体项目出来。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI Deep Research 开源复现 AI智能体
相关文章