原创 小茸茸 2025-04-16 09:33 重庆
OpenAI 为 ChatGPT 新增图片库管理功能;谷歌推出 Gemini 文生视频 & Whisk 图生视频;Mogao 模型揭晓:字节 Seedream 3.0;智谱AI启动A股上市流程并开源三大模型;快手可灵 2.0 大师版发布
OpenAI 为 ChatGPT 新增图片库管理功能
OpenAI[1] ChatGPT 正式推出图片库管理功能,用户所有生成的 AI 图片都将自动归档于此。
该功能已同步上线 Web 端和移动端,终于不用再在聊天记录里找了。
ChatGPT 图片库功能官方公告: https://x.com/OpenAI/status/1912255254512722102
谷歌推出 Gemini 文生视频 & Whisk 图生视频
谷歌在其旗下的 Gemini 和 Whisk 应用中引入了由 Veo2 驱动的视频生成功能[2],需要 Gemini Advanced 或 Google One AI Premium 订阅才能使用。
可以在 Gemini 中进行文生视频,在 Whisk 中进行图生视频,最高能生成 8 秒 720p 的视频。
Gemini 和 Whisk 视频生成功能: https://blog.google/products/gemini/video-generation/
Mogao 模型揭晓:字节 Seedream 3.0
昨日登顶 Artificial Analysis 榜首的 Mogo 模型现已揭晓,居然是字节跳动发布的 Seedream 3.0(即梦 3.0)模型。
该模型拥有业界领先的人像生成质感;目前最强的汉字排版能力;最高支持 2K 分辨率输出。
国内用户可以直接在即梦 AI 平台体验,国际用户则需要填写表单申请测试[3]。
如果是开发者的话可以通过火山引擎[4]接入该模型,目前定价为 0.2 元/张
Mogo 模型国际测试申请表: https://wj.byteoversea.com/q/70989/681IT2v2/b61a/#/
火山引擎 AI 模型接入文档: https://www.volcengine.com/docs/85128/1526761
智谱AI启动A股上市流程并开源三大模型
智谱AI 于 4 月 14 日在北京证监局正式办理上市辅导备案,目标是争取 2025 年内完成 A 股上市。
同时,智谱AI 还开源了 3 个模型[5]:
这些模型现已开源,佬们也可通过智谱新买的域名 z.ai 直接体验。
GLM4系列完整模型列表: https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e
快手可灵 2.0 大师版发布
可灵 2.0[6] 大师版视频生成模型正式发布,带来三大核心升级:
同步推出的可图 2.0 图片生成模型也迎来重要更新,新增局部重绘、智能扩图和风格转绘三大实用功能。
不过可灵 2.0 的价格有点问题,生成 5 秒视频就要 10 块钱(这可能是我的问题,不是它的问题)。
可灵AI视频生成模型官方公告: https://x.com/Kling_ai/status/1912040247023788459
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!