划重点：OpenAI o1/o3的正确打开方式

PaperAgent 01月14日

划重点：OpenAI o1/o3的正确打开方式

苹果前工程师Ben Hylak试用o1 pro后发现其表现不佳，问题在于使用方式。OpenAI CEO山姆奥特曼指出o1并非聊天模型，而是一个“报告生成器”。用户需提供详细背景信息和输出要求，o1会一次性给出解决方案。关键在于提供充足上下文，而非提示。o1会根据懒惰的问题直接处理，不会主动获取上下文。应像对待新员工一样对待o1，详细描述问题空间。此外，o1在简单任务中可能过度推理，用户需了解其擅长和不擅长的方面，如一次性生成文件、幻觉较少、解释复杂概念等。使用语音备忘录等工具可方便提供上下文。

🤔 o1并非聊天模型，而是一个“报告生成器”，用户需要提供详细的背景信息和明确的输出要求，它会一次性给出解决方案。

📝 与传统提示不同，o1不接受“你是一位专家”的指导，而是需要用户提供大量的上下文信息，就像对待新员工一样，详细描述问题空间。

🚀 o1擅长一次性生成多个文件、减少幻觉、解释复杂概念、生成多个计划并比较优缺点，但它不擅长以特定声音/风格写作或构建整个应用程序。

🗣️ 为了方便向o1提供上下文，可以使用语音备忘录等工具，只需描述整个问题空间1-2分钟，然后将转录内容粘贴进去。

2025-01-13 17:51 湖北

苹果&SpaceX前工程师Ben Hylak订阅 200 美元/月的o1 pro 后，经过一天的认真尝试，发现它很差劲：

1、每次我问一个问题，都要等 5 分钟；2、结果看到的只是一大堆自相矛盾的官样文章；3、还有未经请求的架构图 + 优缺点列表。

是o1真的不行吗？还是使用方式不对？重点来了，OpenAI CEO 山姆奥特曼转发：

o1 不是聊天模型（o1 isn’t a chat model）

它更像一个“报告生成器”。如果你给它足够的背景信息，并告诉它你想要输出什么，它通常会一次性给出解决方案。

不要写提示，而要写简介

提供大量的上下文。

o1会直接按照懒惰的问题来处理，不会试图从你那里获取上下文。相反，你需要尽可能多地向o1提供上下文。

简而言之，把o1当作新员工对待。注意o1的错误包括对其应该进行多少推理的推理。有时，方差未能准确映射到任务难度。例如，如果任务真的很简单，它往往会毫无理由地陷入推理的兔子洞。

让o1更容易获取上下文的技巧

建议使用mac/手机上的语音备忘录应用程序。只需描述整个问题空间1-2分钟，然后将转录内容粘贴进去。

出现在产品中的AI助手通常可以更容易地进行这种提取。例如，如果你使用Supabase，尝试让Supabase助手转储/描述所有相关的表/RPC等。

花 10 倍以上的时间去提示

关注目标：描述你想要什么

在大多数模型中，我们被训练成告诉模型我们想要它如何回答我们。例如，“你是一位专家软件工程师。思考要慢+仔细”。

o1成功的方法恰恰相反。我不指导它如何操作——只指导它是什么。然后让o1接管并自行规划和解决问题。这就是自主推理的作用，实际上可能比你手动审查和聊天作为“人类环节”要快得多。

了解o1擅长和不擅长的事情

o1擅长的方面

一次性生成整个/多个文件

幻觉更少

医疗诊断

解释复杂概念

生成多个计划并比较优缺点

额外奖励：评估

o1目前还不擅长的方面

以特定的声音/风格写作

构建整个应用程序

https://www.latent.space/p/o1-skill-issue

推荐阅读

• 对齐LLM偏好的直接偏好优化方法：DPO、IPO、KTO

• 2024：ToB、Agent、多模态

• RAG全景图：从RAG启蒙到高级RAG之36技，再到终章Agentic RAG！

• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解（1.2万字，20+文献，27张图）

欢迎关注我的公众号“PaperAgent”，每天一篇大模型（LLM）文章来锻炼我们的思维，简单的例子，不简单的方法，提升自己。

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

o1 报告生成器上下文 AI工具

相关文章

国金证券：AI工具或模型迭代有望带来投资机会

New hope for an HIV vaccine + 1 more story

Discovering the tuture of AI – Introducing AI Parabellum (an AaI tools directory)

Daily AI News Roundup: 10 AI Events that Caught our Eyes

Cybersixgill Showcases New AI-Powered IQ Report Generator

得到 Prompt 系列（一）：得到文稿品控工具从现在开始，我将陆续将《得到品控手册 9.0》的内容化为 Prompt。以下是 Prompt 来自《得到品控手册》里关于文稿检...

Top AI Excel Tools in 2024

Show HN: 我开发了一款人工智能工具，让开发票变得像说话一样简单

Show HN: 卡通人工智能生成器

科学家应将人工智能作为工具，而非神谕