PaperAgent 02月06日
竟用智能体DeepResearch对比DeepSeek R1模型,OpenAI急了?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI在ChatGPT中推出Deep Research功能,标志着新一代Agentic能力的到来。该功能专为复杂任务的多步骤研究而设计,尤其擅长需要深度和细节的特定领域查询。在“人类终极考试”中,Deep Research的准确率达到26.6%,几乎是DeepSeek-R1的三倍。Deep Research通过端到端强化学习,在复杂浏览和推理任务中训练,由OpenAI o3模型的优化版本提供支持,能够搜索、解读和分析大量文本、图像和PDF文件,并灵活调整方向,实现多个小时复杂手动调查的自动化。

🚀Deep Research是OpenAI在ChatGPT中推出的新功能,具备强大的Agentic能力,能够在互联网上进行多步骤研究,尤其擅长处理需要深度和细节的复杂任务。

🧪Deep Research在“人类终极考试”中表现出色,准确率达到26.6%,远超DeepSeek-R1的9.4%,证明其在多领域知识掌握上的卓越能力。该测试涵盖100多个学科领域,题目超过3000道。

🌐Deep Research的技术核心在于通过端到端强化学习,在多个领域的复杂浏览和推理任务中进行训练,并由OpenAI o3模型的优化版本提供支持。它能高效地搜索、解读和分析互联网上的海量信息,包括文本、图像和PDF文件,并根据遇到的信息灵活调整研究方向。

📊Deep Research 能够使用Python工具绘制和迭代图表,并将生成的图表和网站上的图片嵌入到回答中,同时引用来源中的具体句子或段落,确保信息的准确性和可追溯性。

原创 PaperAgent 2025-02-03 19:16 贵州

Deep Research遥遥领先DeepSeek R1近3倍?

今天,反击DeepSeek开始,OpenAI在ChatGPT中推出了Deep Research功能,新一代的Agentic能力,能够在互联网上为复杂任务进行多步骤的研究。它适合需要深度和细节的多方面、特定领域的查询

特别的,在“人类终极考试(Humanity's Last Exam)”中OpenAI将智能体Deep Research(联网+python工具与当前火热的模型DeepSeek-R1(非多模态,仅在文本子集进行评估)进行了对比:

Deep Research模型的准确率达到了新的高度,为26.6%,是DeepSeek-R1的近三倍(9.4%)

该测试包含超过3000道多项选择题和简答题,涵盖从语言学到火箭科学、古典学到生态学等100多个学科领域

谷歌早在几个月前就发布了AI助理Deep Research,这才是OpenAI Deep Research需要对标的竞品。

谷歌Deep Research是Gemini 2.0高级版中一个Agent功能,用于探索复杂主题文献调研、方案优化),并提供全面且易于阅读的报告,特别适合科研人员和工程师,与OpenAI Deep Research定位接近

OpenAI Deep Research技术要点:

领域(化学、语言学、医疗保健)专家级别示例:Deep Research已经实现了多个小时复杂手动调查的自动化。

https://openai.com/index/introducing-deep-research/

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Deep Research OpenAI Agentic能力 DeepSeek R1
相关文章