原创孔某人 2024-12-12 20:57 北京

只有经常读我文章的人才会明白这句话的意义

继续一篇短文速报。

这个标题很像是一个普通的标题党，但只有经常读我的文章的人才会明白：当我说这句话的时候它的意义。所以本文某种意义上是一个常读用户特化的福利，虽然这并非我故意的，但大概就是会如此。

日常使用场景中的o1

o1有不少优势，例如官方提到的STEM能力（科学Science、技术Technology、工程Engineering、数学Mathematics）与编程。在此之外，过去一个月我也在说o1在STEM和编程之外，也能看到一些显著的提升。

本文则会继续探索o1未知的能力，对其在日常使用中做出进一步判断：在日常使用上，应该使用o1替换GPT-4o，成为大家的默认使用模型。

实际上这个发现只是我在研究o1-pro相对于o1的优势时的副产品。在我目前的对比结果中，在日常问题场景中，o1-pro相对于o1的提升并不显著，但o1相对于4o的提升是显著的，甚至我觉得看4o的答案都是一种时间浪费。

（当然我观察的样本仍然有限，我自觉也可能对LLM目前类CoT的那种回答有一些厌烦，这个结论可能有未来被我推翻的可能。但只要这篇文章我还没删，就表示我仍然认同它。）

以及令人有些惊讶的是，o1的回答速度明显比规模更小的gpt-4o要更快，即使从时间角度也应该使用o1正式版。

关于o1的使用渠道

目前我在研究o1 pro，所以买了200刀的pro会员。但从一般C端用户使用场景来说，我暂时不会建议大家都去买200刀，o1 pro的能力提升我还在探索。

但默认换用o1是显著的。Plus版本的o1使用量受限，如果只是单纯的扩展o1使用量的话可以考虑再买1个Plus账号切换使用。

或者是通过国内的代理商来使用，目前供给还是不错的。

为什么我认为可以称为GPT-5

我发现o1正式版在越来越多的通用方面表现出了对于GPT-4o的显著提升。虽然o1还差一些feature没有补完，但补完它并不困难。

目前我认为先思考再回答的方式就是一种短期更好的途径，即使在To C场景也是如此。所以在我看来o1并不是一个临时性的探索方案，它本身就可以是正途的一个阶段。在o1之前的LLM模型多采用先提取相关信息、再逐步推导回答的方式并不是最佳的给人看的方式，我更希望看到一个信息密度更高的回答、一个先说重点的回答。

ReasonToken扩展定律

（这里让我来“嘲讽”一下最近所谓的密度提升定律。）

我觉得目前来看，我们未来会经历一段时间的reasoning token扩展时期，即每半年平均每个回答需要的reasoning token数量会是原来的X倍。X处大家可以添入自己认同的数值，总之现在还只有o1，样本太少，很难做什么准确的估计，但趋势大概会是这样。

现在各个推理模型还是在单路线性推理的状态，未来扩展到一些简单多路推理也是很可能的，这些都会支撑这个ReasonToken扩展定律一段时间。

LLM的发展目前还没有撞墙

虽然现在连投资人都会觉得LLM发展撞墙了。

但我目前并不这么认为，一方面包括模型厂在内的大家很多时候没有能够充分认知新模型的能力，另外是最近模型集中发布期来看，真的不能说模型发展放缓。我目前就在很兴奋的探索这些最新模型。

未来怎么样不知道，但我在《个人对大模型方向的认知回顾》一文就写了，在过去我是犯了低估模型能力发展速度的错误。

尾记

本文只是一个阶段性快报，一方面提供一个比较好的信息时效性。另外也与我近期的精力规划有关。

可能过一段时间我会再更新“谈我目前在用哪个LLM模型”一文，目前来看很可能新出现的不止o1正式版。

交流与合作

如果希望和我交流讨论，或参与相关的讨论群，或者建立合作，请私信联系，获取联系方式请点击 -> 联系方式。

本文于2024.12.12首发于微信公众号。

跳转微信打开

日常使用场景中的o1

关于o1的使用渠道

为什么我认为可以称为GPT-5

ReasonToken扩展定律

LLM的发展目前还没有撞墙

尾记

交流与合作

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签