快科技资讯 2024年09月14日
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI推出OpenAIo1预览模型,推理能力强,可达理科博士生水准,能解决复杂推理问题,改善机制性缺陷,但仍无法解决某些简单问题。

🥇OpenAIo1预览模型推理能力强大,代表人工智能最强水平之一。官方宣称其可达理科博士生水准,能编写逻辑相对复杂的找松鼠网页游戏,考验其逻辑推理能力。

💪OpenAIo1能解决更加困难的推理问题,相较于现有的大模型,如GPT - 4o等,在解决编程问题时更有条理,会先思考回答流程再动手写代码。

😅然而,OpenAIo1依然存在不足,经过实测,它无法解决'9.11和9.8哪个大'的经典难题,此前AI大模型在这类问题上也集体失智。

快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。

按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来编写一个找松鼠的网页游戏。

这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在3秒后找到出现的松鼠。这类游戏的逻辑相对复杂,更考验OpenAI o1的逻辑推理能力。

官方还表示,相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。

不过,经过实测,OpenAI o1依然无法解决“9.11和9.8哪个大”的经典难题,严重扣分。

因为9.11和9.8哪个大这个问题,之前AI大模型集体失智,所以....

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAIo1 推理能力 编程问题 存在不足
相关文章