Datawhale 01月14日
OpenAI o1模型超全指南来了!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章介绍了O1模型,它并非传统的聊天模型,而是一个报告生成器。与需要迭代交互的聊天模型不同,O1模型需要大量的上下文信息才能一次性输出结果。使用O1的关键在于提供详细的背景资料,包括所有尝试过的方法、数据库架构和业务背景等,如同对待新入职的员工。O1擅长一次性处理多个文件、减少幻觉、进行医疗诊断、解释概念和评估,但在特定风格写作和构建复杂应用方面表现不佳。O1的延迟特性使其适用于需要长时间后台处理的任务,例如需要等待几分钟甚至几天才能完成的任务。

📝 o1模型的核心特点是作为报告生成器而非聊天模型,它需要大量上下文信息才能一次性输出结果,这与聊天模型通过迭代交互获取上下文的方式截然不同。

💼 使用o1的关键在于提供详细的背景信息,包括尝试过的方法、数据库架构和业务背景等,如同对待新入职员工,而不是像使用聊天模型那样进行简单的提问。

🚀 o1擅长一次性处理多个文件,减少幻觉,进行医疗诊断,解释复杂概念以及评估结果,但不太擅长特定风格的写作和构建复杂的应用程序。

⏱️ o1的延迟特性使其适合处理需要长时间后台运行的任务,例如需要等待几分钟甚至几天才能完成的任务,这为产品设计提供了新的可能性。

2025-01-14 23:16 浙江

 Datawhale指南 

者:Ben Hylak,整理:机器之心

在刚刚过去的两天,一篇名为《o1 isn’t a chat model(and that’s the point)》的文章引发了包括 OpenAI CEO Sam Altman、总裁 Greg Brockman 的关注。


这篇文章表示 o1 不是一个聊天模型,我们可以将它想象成一个报告生成器。



原文链接:https://www.latent.space/p/o1-skill-issue


在不改变原意的情况下,进行了如下翻译和整理。


如果 o1 不是聊天模型,那它是什么?


我们可以把它想象成一个报告生成器(report generator)。如果你给定足够的上下文,然后告诉它你想要的输出,o1 通常会一下子确定解决方案。


接下来的问题是,如何使用 o1。


不要写提示,要写 Brief


给它大量的上下文,上下文的数量作者用 ton 来形容,我们可以把它想象成提示的 10 倍。


这张图解释了如何构建一个针对 o1 模型的提示(prompt),并将其分为几个部分。


通常情况下,当你使用像 Claude 3.5 Sonnet 或 4o 这样的聊天模型时,会先提出一个简单的问题并附带一些上下文。如果模型需要更多的上下文,它通常会向你询问。


你会与模型来回迭代,纠正它并扩展需求,直到达到期望的输出。聊天模型本质上是通过这种来回交互的方式从你这里获取上下文。在与模型交互过程中,我们可能会变得越来越懒,只要还能得到好的输出,输入的提示越来越敷衍。


但是,o1 会直接接受那些敷衍的问题,并不会试图从我们这里获取上下文。相反,你需要尽可能多地向 o1 提供上下文。


即使你只是询问一个简单的工程问题,你也需要:



简而言之,我们要把 o1 当作一个新入职的员工来对待。


把更多的时间用在开头提示上。图源:https://x.com/swyx/status/1839213190816870425

专注于目标:准确地描述你想要什么


一旦你向模型提供了尽可能多的上下文,就需要专注于解释你希望输出是什么。


在大多数模型中,我们会告诉模型我们希望它如何回答我们。例如:你是一位专家级软件工程师。你需要模型进行慢思考且思考的很仔细。


这与使用 o1 取得成功的方法完全相反。不要告诉它如何做 —— 只告诉它做什么。然后让 o1 接管,自行规划和解决问题的步骤。这就是自主推理的作用所在,实际上这比你作为人工环节手动审查和聊天要快得多。



知道 o1 擅长什么、不擅长什么


o1 擅长什么:


o1 做得还不够好的地方:



Hylak 尝试让 o1 写这篇博客的一个例子 — — 经过多次反复,它只会写一份平淡的报告。


延迟从根本上改变了我们对产品的体验。考虑一下电子邮件和短信之间的区别 —— 主要是延迟,语音消息与电话通话 —— 延迟,等等。


Hylak 将 o1 称为「报告生成器」,因为 o1 显然不是聊天模型 —— 它感觉更像电子邮件。

Hylak 认为 o1 将首次使某些产品成为可能 —— 例如,可以从高延迟、长时间运行的后台智能中受益的产品。


用户愿意等待 5 分钟来完成什么样的任务?一个小时?一天?3-5 个工作日?如果设计正确的话,有很多。


需要注意的是,o1-preview 和 o1-mini 支持流式传输,但不支持结构化生成或系统提示。o1 支持结构化生成和系统提示,但尚不支持流式传输。


当开发人员在 2025 年设计产品时,实际使用该模型做什么将会非常重要。

一起“三连



阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

O1模型 报告生成器 上下文 延迟 AI应用
相关文章