原创 海野 2024-12-06 04:11 北京
OpenAI放出满血版o1和o1 Pro!
OpenAI的12天直播计划终于开始了,第一天就核心公布了两件事:
满血版的ChatGPT o1,以及o1 Pro mode
200美元的ChatGPT Pro订阅计划
果然第一天就是要拿出来点不一样的!话不多说,直接拿o1的跑分来看看,o1已经遥遥领先,在代码和数学领域远超o1-preview:
满血版o1:更快思考速度、多模态
在o1-preview上线后,OpenAI又对o1模型进行了打磨,打造更擅长编码、数学和写作的推理模型。
现在o1终于放出来了,与我们之前用的o1-preview相比,性能更好,思考更快,答案更准确,幻觉更少,支持多模态。
思考速度
OpenAI团队收到的反馈是,o1-preview思考太慢了,哪怕只是发个“hello”都得思考半天怎么回复。于是在o1里,他们优化了问题的思考速度。
如果是简单问题,o1会很快就回答出来;
如果是复杂问题,o1的思考速度也比o1-preview快50%,大概能提高34%的效率。
在直播时,官方对比了一下。同一个问题,o1用了14秒,o1-preview用了33秒。
性能
官方测试,o1的性能明显优于o1-preview,困难问题的出错率减少了34%。
多模态
o1把视觉功能也带上了,现在能给o1上传图片进行视觉推理了。
API、网页浏览、文件上传等功能后续更新
o1未来还会添加网页浏览、文件上传等功能,以及引入API。开发者喜闻乐见的结构化输出、函数调用和API图像理解也会加上,但具体上线时间未知。
新推出200美元订阅计划
这次OpenAI还带上了一个比Plus订阅贵十倍的新订阅计划……
为什么出这一档付费计划,OpenAI说:
随着 AI 变得越来越先进,它将解决越来越复杂和关键的问题。此外,还需要更多的计算来支持这些功能。
我来翻译一下:我们训练AI的开支太大了,我们需要更多的钱。
ChatGPT Pro订阅计划,每月200美元,能无限制地访问我们最智能的模型 OpenAI o1,以及o1-mini、GPT-4o和Advanced Voice。
终于有无限制使用的选项了,代价是200美元/月。
它还有一个独一档的o1 Pro mode模型,在直播开始几小时前,已经有网友提前看到了这个:
没想到,o1 Pro mode只能在Pro订阅计划上用。
与正常o1相比,o1 Pro mode使用更多的计算来更深入地思考,专门用来解决非常难的数学方面等问题。
总之,就是更专业了。在数学、科学和编码等领域的ML benchmark上,o1 pro mode、o1和o1-preview的表现可以看下图。
为了提高严谨性,OpenAI又重测了一次,第二次测试的规则是:就一个问题重复提问四次,四次都答对才算正常解决。分数如下:
介于o1 Pro mode的思考时间可能非常长,OpenAI还加了个进度条功能,告诉你模型思考到什么情况了。
将来,OpenAI还会在Pro订阅计划中,添加更多强大的计算密集型的模型。
但是200美元真心有亿点贵啊,还是每个月200美元,钱包在滴血……
最后
不得不说,OpenAI为了压住场子,第一天确实放出了我们最想看的:最顶尖的模型o1的更新。就是这个Pro订阅计划的定价太不厚道了。
而且他这个直播是真的短,结束的非常突兀,现在我还有点意犹未尽。
后面还有11天直播,已经铺垫了很久的sora,以及可能会出现、也是我们希望出现的Dall-e-4、AI浏览器、AI设备……以及更多的期货,都赶紧端上来吧!
后续的直播,我也会继续实时跟进,并为大家带来一手消息~
(但不得不说,凌晨两点直播还是太不友好了)
参考资料:https://openai.com/12-days/