OpenAI 为 ChatGPT 新增图片库管理功能；谷歌 Gemini文生视频 & Whisk图生视频；可灵 2.0 大师版

原创小茸茸 2025-04-16 09:33 重庆

OpenAI 为 ChatGPT 新增图片库管理功能；谷歌推出 Gemini 文生视频 & Whisk 图生视频；Mogao 模型揭晓：字节 Seedream 3.0；智谱AI启动A股上市流程并开源三大模型；快手可灵 2.0 大师版发布

OpenAI^[1] ChatGPT 正式推出图片库管理功能，用户所有生成的 AI 图片都将自动归档于此。

该功能已同步上线 Web 端和移动端，终于不用再在聊天记录里找了。

ChatGPT 图片库功能官方公告: https://x.com/OpenAI/status/1912255254512722102

谷歌在其旗下的 Gemini 和 Whisk 应用中引入了由 Veo2 驱动的视频生成功能^[2]，需要 Gemini Advanced 或 Google One AI Premium 订阅才能使用。

可以在 Gemini 中进行文生视频，在 Whisk 中进行图生视频，最高能生成 8 秒 720p 的视频。

Gemini 和 Whisk 视频生成功能: https://blog.google/products/gemini/video-generation/

昨日登顶 Artificial Analysis 榜首的 Mogo 模型现已揭晓，居然是字节跳动发布的 Seedream 3.0（即梦 3.0）模型。

该模型拥有业界领先的人像生成质感；目前最强的汉字排版能力；最高支持 2K 分辨率输出。

国内用户可以直接在即梦 AI 平台体验，国际用户则需要填写表单申请测试^[3]。

如果是开发者的话可以通过火山引擎^[4]接入该模型，目前定价为 0.2 元/张

Mogo 模型国际测试申请表: https://wj.byteoversea.com/q/70989/681IT2v2/b61a/#/
火山引擎 AI 模型接入文档: https://www.volcengine.com/docs/85128/1526761

智谱AI 于 4 月 14 日在北京证监局正式办理上市辅导备案，目标是争取 2025 年内完成 A 股上市。

同时，智谱AI 还开源了 3 个模型^[5]：

GLM4 32B 0414：基础大模型，能力对标 DeepSeek V3

GLM Z1 32B 0414：专为推理任务优化的版本，对标 DeepSeek R1

GLM Z1 Rumination：针对 Agent 场景特别强化训练的专用模型

这些模型现已开源，佬们也可通过智谱新买的域名 z.ai 直接体验。

GLM4系列完整模型列表: https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e

可灵 2.0^[6] 大师版视频生成模型正式发布，带来三大核心升级：

语义理解能力显著增强，响应更精准

动态画面质量全面提升，支持大幅运动场景

画面质感优化，连续画面更流畅自然

同步推出的可图 2.0 图片生成模型也迎来重要更新，新增局部重绘、智能扩图和风格转绘三大实用功能。

不过可灵 2.0 的价格有点问题，生成 5 秒视频就要 10 块钱（这可能是我的问题，不是它的问题）。

可灵AI视频生成模型官方公告: https://x.com/Kling_ai/status/1912040247023788459

❝
如果你喜欢《一觉醒来 AI 界发生了什么》系列的话，请关注、点赞、在看、收藏、分享五连警告，这对我真的很重要！

Fish AI Reader