o1满血版泄露！具有奥特曼所说的图像推理能力

夕小瑶科技说 2024年11月05日

o1满血版泄露！具有奥特曼所说的图像推理能力

OpenAI的o1满血版被发现已在ChatGPT官网部署，网友可卡bug使用。该模型具有图像推理能力，支持上传附件，能解决多种难题，但也有翻车情况。此次泄露持续3小时，有人认为是精心策划，且奥特曼已开始为o2吹风。

💥OpenAI o1满血版在ChatGPT官网可卡bug使用

🎯该模型有图像推理能力，支持上传附件

😅虽能解决不少难题，但也存在翻车案例

🤔此次泄露被认为是精心策划

2024-11-04 15:17 北京

夕小瑶科技说分享
来源 | 量子位

o1满血版泄露了！没想到，OpenAI还搁那儿“今年一定”呢，不少网友已经率先上手体验到了（doge）。

事情是酱婶的：有网友发现，OpenAI已经在ChatGPT官网上部署了完整版o1，大家伙儿还都能卡bug直接用！

最初发现此事的网友，测试确认泄露模型具有奥特曼所说的图像推理能力。

图源：?@legit_rumors

而日志也显示该模型就是o1本模。

于是，赶在OpenAI出手修复之前，网友们抓紧大玩特玩了一波——

满血o1到底有多牛

和已经发布的o1-preview、o1-mini最直观的不同是，泄露出来的o1支持上传附件。这也就意味着，终于能测测o1的多模态能力了。网友们也不说废话，直接上强度，普特南数学竞赛的证明题截图一贴，甩给满血o1。

对正整数n，有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n，使得|fn(0)|＞2023。

思考了18秒之后，o1给出答案：18。

答案正确：

再来一道更复杂的，虽然在识图上遇到了一点小问题，但还是稳稳做对了。

在如此惊艳表现之下，似乎正确识别人类史上首张黑洞照片也不算什么了（doge）。

不过嘛，也不是没有翻车案例。比如，让大模型数数图里有多少个三角形。

ID为anagh的?网友，给泄露模型和GPT-4o做了个同屏对比：

4o速度很快，给出了错误答案19。而满血o1花了1分39秒，狂刷一堆token……给出了不同的错误答案：29。正确答案是24。

这个bug现在已经修复了。不过，有意思的是，这次模型泄露，持续了整整3个小时。

不小心还是故意的？

有网友犀利地点出，这事儿看上去不是“不小心”，而是“精心策划”：

目的是让人们对即将发布的模型有一个预期。

不少网友赞同这样的观点：

奥特曼的目的是测试和炒作。

而由于一切看上去已经部署就绪，甚至有人猜测，o1完整版的正式上线时间就在未来一周之内。

值得注意的是，就在这次泄露事件之后，奥特曼马上在?上开始了自己的表演：

好家伙，都已经吹上o2的风了（还假装上错号……）。

至于为什么是这个时间……那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛（doge）。

参考资料 https://x.com/legit\_rumors/status/1852625385801859321
https://x.com/koltregaskes/status/1852657291469709626
https://x.com/anaghnairr/status/1852668741751919016

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI o1 模型泄露图像推理精心策划

相关文章

详解OpenAI刚憋出来的大招：它拥有真正的通用推理能力

OpenAI全新发布o1模型 - 我们正式迈入了下一个时代

AI会“慢思考”！OpenAI发布全新o1系列模型，ChatGPT付费用户已破1100万

实测OpenAI最强模型o1：会做大学数理化但弱智吧依然难解

大招憋出来了！OpenAI发布最强推理模型o1，它真的会思考，但API比4o贵好几倍

草莓难救被“月抛”的AI对话产品？

OpenAI o1模型背后的核心人才？清北复旦华人立功

OpenAI o1模型背后的核心人才？清北复旦华人立功

OpenAI o1惊现自我意识？陶哲轩实测大受震撼，门萨智商100夺模型榜首

OpenAI o1 团队在线答疑：o1的o指OpenAI，强化后的推理有泛化能力，未来模型思考时间可控！