孔某人的低维认知 2024年12月13日
o1正式版 就是我心中的GPT-5
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文作者通过日常使用对比,发现o1模型在通用性方面显著优于GPT-4o,认为其可能成为GPT-5的有力竞争者。作者强调o1在日常问题场景中的高效性,并指出其回答速度更快。尽管o1-pro的提升不明显,但o1的优势足以使其成为默认使用模型。文章还探讨了ReasonToken扩展定律,预测未来推理模型将扩展到多路推理。作者对LLM的发展前景持乐观态度,认为目前尚未触及瓶颈。文章最后提到,未来可能更新关于LLM使用的文章。

🚀o1模型在日常使用中展现出超越GPT-4o的显著优势,尤其在通用性方面表现突出,这使得它有潜力成为GPT-5的竞争者。

⏱️o1模型不仅在回答质量上更胜一筹,其响应速度也明显快于GPT-4o,这在时间效率上具有显著优势,因此作者推荐将o1作为默认使用模型。

💡文章提出ReasonToken扩展定律,预测未来LLM的推理能力将扩展,并从单路线性推理发展到多路推理,这将是LLM发展的一个重要趋势。

📈作者对LLM的未来发展持乐观态度,认为目前的发展并未触及瓶颈,并强调了深入认知新模型能力的重要性,以及最近模型集中发布的事实。

原创 孔某人 2024-12-12 20:57 北京

只有经常读我文章的人才会明白这句话的意义

继续一篇短文速报。

这个标题很像是一个普通的标题党,但只有经常读我的文章的人才会明白:当我说这句话的时候它的意义。所以本文某种意义上是一个常读用户特化的福利,虽然这并非我故意的,但大概就是会如此。

日常使用场景中的o1

o1有不少优势,例如官方提到的STEM能力(科学Science、技术Technology、工程Engineering、数学Mathematics)与编程。在此之外,过去一个月我也在说o1在STEM和编程之外,也能看到一些显著的提升。

本文则会继续探索o1未知的能力,对其在日常使用中做出进一步判断:在日常使用上,应该使用o1替换GPT-4o,成为大家的默认使用模型

实际上这个发现只是我在研究o1-pro相对于o1的优势时的副产品。在我目前的对比结果中,在日常问题场景中,o1-pro相对于o1的提升并不显著,但o1相对于4o的提升是显著的,甚至我觉得看4o的答案都是一种时间浪费。

(当然我观察的样本仍然有限,我自觉也可能对LLM目前类CoT的那种回答有一些厌烦,这个结论可能有未来被我推翻的可能。但只要这篇文章我还没删,就表示我仍然认同它。)

以及令人有些惊讶的是,o1的回答速度明显比规模更小的gpt-4o要更快,即使从时间角度也应该使用o1正式版。

关于o1的使用渠道

目前我在研究o1 pro,所以买了200刀的pro会员。但从一般C端用户使用场景来说,我暂时不会建议大家都去买200刀,o1 pro的能力提升我还在探索。

但默认换用o1是显著的。Plus版本的o1使用量受限,如果只是单纯的扩展o1使用量的话可以考虑再买1个Plus账号切换使用

或者是通过国内的代理商来使用,目前供给还是不错的。

为什么我认为可以称为GPT-5

我发现o1正式版在越来越多的通用方面表现出了对于GPT-4o的显著提升。虽然o1还差一些feature没有补完,但补完它并不困难。

目前我认为先思考再回答的方式就是一种短期更好的途径,即使在To C场景也是如此。所以在我看来o1并不是一个临时性的探索方案,它本身就可以是正途的一个阶段。在o1之前的LLM模型多采用先提取相关信息、再逐步推导回答的方式并不是最佳的给人看的方式,我更希望看到一个信息密度更高的回答、一个先说重点的回答。

ReasonToken扩展定律

(这里让我来“嘲讽”一下最近所谓的密度提升定律。)

我觉得目前来看,我们未来会经历一段时间的reasoning token扩展时期,即每半年平均每个回答需要的reasoning token数量会是原来的X倍。X处大家可以添入自己认同的数值,总之现在还只有o1,样本太少,很难做什么准确的估计,但趋势大概会是这样。

现在各个推理模型还是在单路线性推理的状态,未来扩展到一些简单多路推理也是很可能的,这些都会支撑这个ReasonToken扩展定律一段时间。

LLM的发展目前还没有撞墙

虽然现在连投资人都会觉得LLM发展撞墙了。

但我目前并不这么认为,一方面包括模型厂在内的大家很多时候没有能够充分认知新模型的能力,另外是最近模型集中发布期来看,真的不能说模型发展放缓。我目前就在很兴奋的探索这些最新模型。

未来怎么样不知道,但我在《个人对大模型方向的认知回顾》一文就写了,在过去我是犯了低估模型能力发展速度的错误。

尾记

本文只是一个阶段性快报,一方面提供一个比较好的信息时效性。另外也与我近期的精力规划有关。

可能过一段时间我会再更新“谈我目前在用哪个LLM模型”一文,目前来看很可能新出现的不止o1正式版。


交流与合作

如果希望和我交流讨论,或参与相关的讨论群,或者建立合作,请私信联系,获取联系方式请点击 -> 联系方式

本文于2024.12.12首发于微信公众号。

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

o1模型 GPT-4o ReasonToken LLM发展 模型对比
相关文章