cnBeta全文版 21小时前
测试暗示 Microsoft Copilot 可能会免费提供 ChatGPT 的 o4-mini-high
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文探讨了微软Copilot在免费提供ChatGPT功能时使用的模型。重点关注Copilot的“Think Deeper”功能,该功能最初使用o3-mini-high模型,知识截止日期为2023年10月。微软正在对o4-mini-high(或o4-mini)模型进行A/B测试。文章还提到了Copilot的两种模式:“快速响应”和“Think Deeper”,以及Copilot Pro订阅提供的额外功能。通过测试,确认了Copilot在不同账户下使用的模型差异,并总结了OpenAI模型的知识截止日期。最后,文章对比了o3-mini和o4-mini在AIME数学测试中的表现,强调了o4-mini的性能优势。

🤔Copilot的“Think Deeper”功能正在进行模型升级测试,从o3-mini-high切换到o4-mini-high(或o4-mini)。

💡默认情况下,Copilot提供两种模式;付费的Copilot Pro订阅则提供三种模式,其中“Think Deeper”是推理模型,旨在提供更深入的回答。

📅o3-mini-high模型的知识截止日期为2023年10月,而o4-mini-high模型的知识截止日期为2024年6月,这表明Copilot正在逐步更新其知识库。

📈o4-mini在AIME数学测试中的表现优于o3-mini,表明新模型在推理能力和知识广度上有所提升。

🔬微软正在进行A/B测试,以评估o4-mini-high(或o4-mini)模型的性能,并可能在未来全面推广该模型。

Copilot 并不受欢迎,但它在免费提供部分 ChatGPT 功能方面做得相当不错,但同时也受到审查和限制。目前,Copilot 的 Think Deeper 功能使用的是 o3-mini-high 模型,其知识截止日期为 2023 年 10 月,但微软现在似乎正在对 o4-mini-high(或常规 o4-mini)模型进行 A/B 测试。

默认情况下,Copilot 有两种模式,如果您支付 20 美元的 Copilot Pro 订阅费用,则有三种模式(深度研究)。一种是“快速响应”,它使用 OpenAI 的常规模型之一;另一种是“Think Deeper”,这是一个推理模型。2025 年 3 月,微软确认“Think Deeper”开关将启用 o3-mini-high,这是 OpenAI 的高级模型之一。

微软在 2025 年 3 月的发布说明中指出: “Think Deeper 的推理模型已升级到 OpenAI 的 o3-mini(高端)。这意味着你将能够更快地获得答案。”

o3-mini-high 的知识截止日期为 2023 年 10 月,并且不再随 ChatGPT Plus、Pro 或 Teams/Enterprise 提供。OpenAI 已用 o4-mini-high 取代了该模型,微软也在效仿。

Microsoft Copilot 暂时将 o3-mini-high 替换为 o4-mini-high(或 o4-mini)

看看下面的截图,询问 Copilot 的 Think Deeper 知识截止日期是什么时候,它明确地写着 2023 年 10 月,而且非常有把握。这证实了它在本次特定会话中仍然处于 o3-mini-high 状态:


但是,当使用我的一个 Microsoft 帐户并询问 Copilot 在开启 Think Deeper 的情况下其知识截止日期是什么时,训练数据将持续到 2024 年 6 月。


测试发现它似乎是 o4-mini-high 模型,其知识截止日期为 2024 年 6 月。它也可能是 o4-mini,但我假设它是 o4-mini-high,因为微软已将“-high”变体用于 Copilot 的 o3-mini 集成。

OpenAI 模型的知识截止日期汇总:

o3-mini / o3-mini-high:2023 年 10 月 1 日

o3:2024年6月1日

o4-mini / o4-mini-high:2024 年 6 月 1 日

GPT-4.1 系列(GPT-4.1、GPT-4.1 mini、GPT-4.1 nano):2024 年 6 月

“Think Deeper” 有可能使用 o3 吗?o3 的知识截止日期也是 2024 年 6 月?我不这么认为。o3 模型成本高昂,用它来取代 30 秒的“Think Deeper” 毫无意义,但也不能 100% 排除这种可能性。

OpenAI 表示,o4-mini 的表现明显优于前代产品,但价格仍然更低。例如,在 AIME 数学测试中,o3-mini 在 2024 年考试中的得分约为 87%,2025 年的得分约为 86.5%,而 o4-mini 在 2024 年考试中的得分约为 93.4%,2025 年的得分约为 92.7%。


至于“-high”变体,与o3-mini-high相比,o4-mini-high变体花费更多时间“思考”,从而提高了其质量。

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Copilot o4-mini o3-mini-high 模型升级 AI
相关文章