三花AI 2024年12月18日
谷歌 Veo2 顶级视频生成模型;Imagen 3 艺术风格与细节渲染增强;一体化图像编辑与修复技术;OpenAI o1 API
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文概述了近期AI领域的几项重大进展。谷歌推出了Veo2视频生成模型,支持高达4K分辨率,并能根据提示词控制相机运动,效果卓越。同时,Imagen 3模型也进行了升级,在艺术风格和细节渲染方面表现更强,成为顶级的图像生成模型。腾讯开源了BrushEdit,一款集图像编辑与修复于一体的技术,支持自由编辑和修复。此外,OpenAI发布了o1推理模型API,支持WebRTC和新的微调方法,并降低了价格。这些技术进步预示着AI在视频、图像处理和模型推理方面的巨大潜力。

🎬 谷歌Veo2模型:支持文生视频和图生视频,能够生成高达4K分辨率的视频,并根据提示词完成相机控制,效果惊艳,甚至超越Sora。

🎨 谷歌Imagen 3升级:不仅支持更多艺术风格,还能更精准地遵循提示词,渲染出更加丰富的细节和纹理,成为目前最强的图像生成模型。

🖌️ 腾讯BrushEdit开源:是一款一体化图像编辑和修复技术,利用多模态大语言模型和图像修复模型,用户可以轻松移除或添加对象,编辑背景,效果显著。

⚙️ OpenAI o1推理API:支持函数调用和结构化输出,Realtime API支持WebRTC,且价格有所降低,并推出了全新的模型微调方法Preference Fine-Tuning。

原创 小茸茸 2024-12-18 09:37 重庆

​谷歌推出 Veo2:顶级视频生成模型;谷歌 Imagen 3 升级:艺术风格与细节渲染全面增强;腾讯开源 BrushEdit:一体化图像编辑与修复技术;OpenAI 推出 o1 推理模型 API,支持 WebRTC 和全新微调方法

谷歌推出 Veo2:顶级视频生成模型

谷歌发布了 Veo2[1]  视频模型,支持文生视频和图生视频。

该模型能够生成分辨率高达 4K 的视频,并能根据提示词完成相机控制,如广角镜头、POV 和无人机拍摄,更好地遵循物理效果。

从官方演示来看,效果非常出色,甚至优于 Sora。目前,还需要加入 VideoFX[2] 的候补名单才有机会体验。

谷歌 Imagen 3 升级:艺术风格与细节渲染全面增强

谷歌的 Imagen 3[3] 模型再次升级,这次更新不仅支持更多艺术风格,还能更精准地遵循提示词,渲染出更加丰富的细节和纹理。

此次更新使其成为最强生图模型,基准测试表现甚至超越了 RecraftV3。谷歌在大模型、视频生成和图像生成领域正式全面领先,直接放大招,没有 12days。

腾讯开源 BrushEdit:一体化图像编辑与修复技术

BrushEdit[4] 是腾讯开源的一体化图像编辑和修复技术,它利用多模态大语言模型和图像修复模型,实现了自由编辑和修复。

用户可以轻松移除对象、添加对象,进行背景编辑和对象替换。效果不错,还有个在线演示[5]可以玩一下。

OpenAI 推出 o1 推理模型 API,支持 WebRTC 和全新微调方法

OpenAI 在 12Days 活动第 9 天正式发布了 o1 推理模型的 API,支持函数调用和结构化输出。现在 Realtime API 支持 WebRTC,并且价格有所降低。此外,还推出了一种全新的模型微调方法 Preference Fine-Tuning。

此外,还有价格更新和新的sdk发布,完整的细节可以看公告[6]


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

现在加入 AI 日报群,不会漏掉消息嗷

Reference

[1]

Veo2 视频模型: https://deepmind.google/technologies/veo/veo-2/

[2]

VideoFX 候补名单: https://labs.google/fx/tools/video-fx

[3]

Imagen 3 模型官网: https://deepmind.google/technologies/imagen-3/

[4]

BrushEdit 官网: https://liyaowei-stu.github.io/project/BrushEdit/

[5]

BrushEdit 在线演示: https://huggingface.co/spaces/TencentARC/BrushEdit

[6]

OpenAI 官方公告: https://openai.com/index/o1-and-new-tools-for-developers/


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Veo2 Imagen 3 BrushEdit o1 API
相关文章