PaperAgent 01月14日
划重点:OpenAI o1/o3的正确打开方式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

苹果前工程师Ben Hylak试用o1 pro后发现其表现不佳,问题在于使用方式。OpenAI CEO山姆奥特曼指出o1并非聊天模型,而是一个“报告生成器”。用户需提供详细背景信息和输出要求,o1会一次性给出解决方案。关键在于提供充足上下文,而非提示。o1会根据懒惰的问题直接处理,不会主动获取上下文。应像对待新员工一样对待o1,详细描述问题空间。此外,o1在简单任务中可能过度推理,用户需了解其擅长和不擅长的方面,如一次性生成文件、幻觉较少、解释复杂概念等。使用语音备忘录等工具可方便提供上下文。

🤔 o1并非聊天模型,而是一个“报告生成器”,用户需要提供详细的背景信息和明确的输出要求,它会一次性给出解决方案。

📝 与传统提示不同,o1不接受“你是一位专家”的指导,而是需要用户提供大量的上下文信息,就像对待新员工一样,详细描述问题空间。

🚀 o1擅长一次性生成多个文件、减少幻觉、解释复杂概念、生成多个计划并比较优缺点,但它不擅长以特定声音/风格写作或构建整个应用程序。

🗣️ 为了方便向o1提供上下文,可以使用语音备忘录等工具,只需描述整个问题空间1-2分钟,然后将转录内容粘贴进去。

2025-01-13 17:51 湖北

苹果&SpaceX前工程师Ben Hylak订阅 200 美元/月的o1 pro 后,经过一天的认真尝试,发现它很差劲:

 1、每次我问一个问题,都要等 5 分钟;2、结果看到的只是一大堆自相矛盾的官样文章;3、还有未经请求的架构图 + 优缺点列表。

是o1真的不行吗?还是使用方式不对?重点来了,OpenAI CEO 山姆奥特曼转发:

o1 不是聊天模型(o1 isn’t a chat model

它更像一个“报告生成器”。如果你给它足够的背景信息,并告诉它你想要输出什么,它通常会一次性给出解决方案。

不要写提示,而要写简介

提供大量的上下文。

o1会直接按照懒惰的问题来处理,不会试图从你那里获取上下文。相反,你需要尽可能多地向o1提供上下文。

简而言之,把o1当作新员工对待。注意o1的错误包括对其应该进行多少推理的推理。有时,方差未能准确映射到任务难度。例如,如果任务真的很简单,它往往会毫无理由地陷入推理的兔子洞。

让o1更容易获取上下文的技巧

    建议使用mac/手机上的语音备忘录应用程序。只需描述整个问题空间1-2分钟,然后将转录内容粘贴进去。

    出现在产品中的AI助手通常可以更容易地进行这种提取。例如,如果你使用Supabase,尝试让Supabase助手转储/描述所有相关的表/RPC等。

花 10 倍以上的时间去提示

关注目标:描述你想要什么

在大多数模型中,我们被训练成告诉模型我们想要它如何回答我们。例如,“你是一位专家软件工程师。思考要慢+仔细”。

o1成功的方法恰恰相反。我不指导它如何操作——只指导它是什么。然后让o1接管并自行规划和解决问题。这就是自主推理的作用,实际上可能比你手动审查和聊天作为“人类环节”要快得多。

了解o1擅长和不擅长的事情

    o1擅长的方面

o1目前还不擅长的方面

https://www.latent.space/p/o1-skill-issue

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

o1 报告生成器 上下文 AI工具
相关文章