竟用智能体DeepResearch对比DeepSeek R1模型，OpenAI急了？

PaperAgent 02月06日

竟用智能体DeepResearch对比DeepSeek R1模型，OpenAI急了？

OpenAI在ChatGPT中推出Deep Research功能，标志着新一代Agentic能力的到来。该功能专为复杂任务的多步骤研究而设计，尤其擅长需要深度和细节的特定领域查询。在“人类终极考试”中，Deep Research的准确率达到26.6%，几乎是DeepSeek-R1的三倍。Deep Research通过端到端强化学习，在复杂浏览和推理任务中训练，由OpenAI o3模型的优化版本提供支持，能够搜索、解读和分析大量文本、图像和PDF文件，并灵活调整方向，实现多个小时复杂手动调查的自动化。

🚀Deep Research是OpenAI在ChatGPT中推出的新功能，具备强大的Agentic能力，能够在互联网上进行多步骤研究，尤其擅长处理需要深度和细节的复杂任务。

🧪Deep Research在“人类终极考试”中表现出色，准确率达到26.6%，远超DeepSeek-R1的9.4%，证明其在多领域知识掌握上的卓越能力。该测试涵盖100多个学科领域，题目超过3000道。

🌐Deep Research的技术核心在于通过端到端强化学习，在多个领域的复杂浏览和推理任务中进行训练，并由OpenAI o3模型的优化版本提供支持。它能高效地搜索、解读和分析互联网上的海量信息，包括文本、图像和PDF文件，并根据遇到的信息灵活调整研究方向。

📊Deep Research 能够使用Python工具绘制和迭代图表，并将生成的图表和网站上的图片嵌入到回答中，同时引用来源中的具体句子或段落，确保信息的准确性和可追溯性。

原创 PaperAgent 2025-02-03 19:16 贵州

Deep Research遥遥领先DeepSeek R1近3倍？

今天，反击DeepSeek开始，OpenAI在ChatGPT中推出了Deep Research功能，新一代的Agentic能力，能够在互联网上为复杂任务进行多步骤的研究。它适合需要深度和细节的多方面、特定领域的查询。

特别的，在“人类终极考试（Humanity's Last Exam）”中OpenAI将智能体Deep Research（联网+python工具）与当前火热的模型DeepSeek-R1（非多模态，仅在文本子集进行评估）进行了对比：

Deep Research模型的准确率达到了新的高度，为26.6%，是DeepSeek-R1的近三倍（9.4%）。

该测试包含超过3000道多项选择题和简答题，涵盖从语言学到火箭科学、古典学到生态学等100多个学科领域

而谷歌早在几个月前就发布了AI助理Deep Research，这才是OpenAI Deep Research需要对标的竞品。

谷歌Deep Research是Gemini 2.0高级版中一个Agent功能，用于探索复杂主题（文献调研、方案优化），并提供全面且易于阅读的报告，特别适合科研人员和工程师，与OpenAI Deep Research定位接近。

OpenAI Deep Research技术要点：

Deep Research是通过端到端强化学习，在多个领域的复杂浏览和推理任务中进行训练的。

Deep Research由即将发布的OpenAI o3模型的一个优化版本提供支持，该版本专门用于网络浏览和数据分析。

Deep Research利用推理能力在互联网上搜索、解读和分析大量的文本、图像和PDF文件，并根据遇到的信息灵活调整方向。使用Python工具绘制和迭代图表，将生成的图表和网站上的图片嵌入其回答中，并引用其来源中的具体句子或段落。

领域（化学、语言学、医疗保健）专家级别示例：Deep Research已经实现了多个小时复杂手动调查的自动化。

https://openai.com/index/introducing-deep-research/

推荐阅读

• 对齐LLM偏好的直接偏好优化方法：DPO、IPO、KTO

• DeepSeek R1/o1大型推理模型蓝图：架构设计及快速原型实现框架x1

• RAG全景图：从RAG启蒙到高级RAG之36技，再到终章Agentic RAG！

• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解（1.2万字，20+文献，27张图）

欢迎关注我的公众号“PaperAgent”，每天一篇大模型（LLM）文章来锻炼我们的思维，简单的例子，不简单的方法，提升自己。

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Deep Research OpenAI Agentic能力 DeepSeek R1

相关文章

OpenAI加入C2PA指導委員會，測試Deepfake圖像偵測工具

How popular is ChatGPT? Part 1: more popular than Taylor Swift

OpenAI set to unveil AI-driven challenger to Google Search

OpenAI faces complaint over fictional outputs

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

苹果据悉接近与OpenAI达成协议，将ChatGPT应用于iPhone

OpenAI据悉正开发AI语音助手

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Government-issued digital money gets closer - The World News Papers

Comment on What should the UK’s £100 million Foundation Model Taskforce do? by Il denaro digitale emesso dal governo si sta avvicinando - Darios Cafe Blogs

Codex, OpenAI’s Automated Code Generation API with Greg Brockman - #509