原创 小茸茸 2024-10-17 09:23 重庆
PIKA AI 全新视频特效;Open-Sora-Plan v1.3.0 改进;CoTracker3实现丝滑的像素级目标追踪;Suno Scenes根据视频和图像生成音乐;comfyui-Fluxtapoz实现谷歌 RF-Inversion
Mistra 推出世界顶级边缘计算小模型
Les Ministraux[1] 官方宣称其边缘模型为世界上最好的,包含 3B 和 8B 两个版本,在各种基准测试中均超越了 Llama 3.2 和 Gemma 2 的同参数量模型。这次只开源了 8B 模型,但仅限研究使用,商用需另行申请。
PIKA AI 发布 4 种全新视频特效
PIKA AI 昨晚公布了 4 种新的视频特效[2],分别是碎块、漏气、湮灭和消失。上次发布的融化、爆炸、挤压特效曾风靡一时,不知这次会不会又擦出火花。
Open-Sora-Plan v1.3.0 发布:五大改进
Open-Sora-Plan[3] 昨晚发布了 v1.3.0,新版本带来了五大显著改进:
高性能 WFVAE
Prompt Refiner 优化短提示词输入
高质量的数据清理策略
DiT 优化
动态分辨率和动态持续时间此外,作者在 B 站发布了一个《黑神话悟空第三结局AI创意短片》演示视频,虽然离商业模型还有很大差距,但展示了项目的潜力。完整改动和细节介绍可以查看 Report-v1.3.0[4]。
Meta AI 推出 CoTracker3:实现丝滑的像素级目标追踪
Meta AI 在 CoTracker 的基础上,推出了 CoTracker3[5],这一新模型在跟踪点被遮挡时,依然能够长时间保持丝滑的跟踪效果,表现非常出色。官方还提供了一个在线试用[6],体验后我愿称之为最强点跟踪模型。
Suno AI 推出 Suno Scenes:根据视频和图像生成音乐
Suno Scenes[7] 功能,可以根据图片或视频生成音乐。不过,目前该功能仅支持 Suno 的 iOS 客户端,并且仅在美国地区可用。
comfyui-Fluxtapoz:实现谷歌 RF-Inversion
comfyui-Fluxtapoz[8] 是一个实现了昨天介绍的《谷歌 RF-Inversion:增强版 IpAdapter[9]》的 Comfyui 插件。作者表示目前还是 WIP 阶段,距离论文的效果还差点,若有问题会继续更新。
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!
Reference
[1]
Les Ministraux 官方公告: https://mistral.ai/news/ministraux/
[2]4 种新的视频特效: https://x.com/pika_labs/status/1846295401491845213
[3]Open-Sora-Plan 项目主页: https://github.com/PKU-YuanGroup/Open-Sora-Plan
[4]Report-v1.3.0 文档: https://github.com/PKU-YuanGroup/Open-Sora-Plan/blob/main/docs/Report-v1.3.0.md
[5]CoTracker3 官方网站: https://cotracker3.github.io/
[6]CoTracker3 在线试用: https://huggingface.co/spaces/facebook/cotracker
[7]Suno AI 的 Suno Scenes 功能: https://x.com/suno_ai_/status/1846574384963633345
[8]comfyui-Fluxtapoz 插件: https://github.com/logtd/ComfyUI-Fluxtapoz
[9]谷歌 RF-Inversion:增强版 IpAdapter 论文: https://sanhua.himrr.com/news/cece0867-92d7-4bc6-b0b1-0d18bc28f1f4