DeepSeek-V3 非推理模型首次登顶排行榜，开源模型里程碑时刻啊！OpenAI 推出 GPT-4o 图像生成

小茸茸 2025-03-26 09:30 重庆

OpenAI 推出了 GPT-4o 的图像生成功能；谷歌 Gemini 2.5 Pro 实验版发布：登顶 Chatbot Arena；DeepSeek-V3 非推理模型首次登顶排行榜

OpenAI 推出了 GPT-4o 的图像生成功能，它取代了此前使用的DALL-E 3模型，利用GPT-4o的原生多模态能力，能够支持渲染文本，支持从写实风格到艺术插图的多种风格，能处理复杂的用户指令，并保持一致性，还能通过多轮对话逐步调整和完善图像。

目前，该功能已集成到 ChatGPT 中，所有人都可以在对话中输入生图请求即可使用，API 将在未来几周内提供。当然这玩意不是万能的，偶尔会出现幻觉（hallucination）、数学图表生成不够准确，以及多语言文本支持有限。

更多细节和演示可以看官方介绍^[1]。

OpenAI 推出了 GPT-4o 的图像生成功能: https://openai.com/index/introducing-4o-image-generation/

谷歌正式推出 Gemini 2.5 Pro 实验版（gemini-2.5-pro-exp-03-25），这是一款推理模型，在 Chatbot Arena 评测中荣登榜首。

它支持高达 100 万 token 的上下文窗口，能够处理和理解多模态内容——包括文本、音频、图像、视频甚至整个代码库。

佬们可以在 ai.dev 上免费试用（官方博客^[2]有完整更新细节），不过免费版本注意速率限制：每分钟 2 次请求，每天上限 50 次请求。

Gemini 2.5 Pro 三月更新公告: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025

DeepSeek 前天低调发布了 V3-0324 模型更新，昨天终于发布了官方公告^[3]。

主要更新内容包括：

借鉴 DeepSeek-R1 模型大幅提升推理能力

在前端开发任务（如 HTML 等代码生成）上表现更出色，代码可用性和设计美观度都有提升。（前端佬们又要失业了

中文写作基于 R1 的写作水平进一步优化，特别提升了中长篇内容质量

中文搜索能力显著优化

此外，在工具调用、角色扮演、问答闲聊等方面也有明显的能力提升。

该模型目前在 Artificial Analysis 排行榜中成为得分最高的非推理模型 - 这也是开源非推理模型的首次领先，是开源模型的里程碑时刻啊！

DeepSeek V3-0324更新公告: https://api-docs.deepseek.com/zh-cn/news/news250325

❝
如果你喜欢《一觉醒来 AI 界发生了什么》系列的话，请关注、点赞、在看、收藏、分享五连警告，这对我真的很重要！

Fish AI Reader