Mistra 推出世界顶级边缘计算小模型；PIKA 全新视频特效；Open-Sora-Plan最新发布；Suno 视频和图生音乐

原创小茸茸 2024-10-17 09:23 重庆

PIKA AI 全新视频特效；Open-Sora-Plan v1.3.0 改进；CoTracker3实现丝滑的像素级目标追踪；Suno Scenes根据视频和图像生成音乐；comfyui-Fluxtapoz实现谷歌 RF-Inversion

Mistra 推出世界顶级边缘计算小模型

Les Ministraux^[1] 官方宣称其边缘模型为世界上最好的，包含 3B 和 8B 两个版本，在各种基准测试中均超越了 Llama 3.2 和 Gemma 2 的同参数量模型。这次只开源了 8B 模型，但仅限研究使用，商用需另行申请。

PIKA AI 发布 4 种全新视频特效

PIKA AI 昨晚公布了 4 种新的视频特效^[2]，分别是碎块、漏气、湮灭和消失。上次发布的融化、爆炸、挤压特效曾风靡一时，不知这次会不会又擦出火花。

Open-Sora-Plan v1.3.0 发布：五大改进

Open-Sora-Plan^[3] 昨晚发布了 v1.3.0，新版本带来了五大显著改进：

高性能 WFVAE

Prompt Refiner 优化短提示词输入

高质量的数据清理策略

DiT 优化

动态分辨率和动态持续时间此外，作者在 B 站发布了一个《黑神话悟空第三结局AI创意短片》演示视频，虽然离商业模型还有很大差距，但展示了项目的潜力。完整改动和细节介绍可以查看 Report-v1.3.0^[4]。

Meta AI 推出 CoTracker3：实现丝滑的像素级目标追踪

Meta AI 在 CoTracker 的基础上，推出了 CoTracker3^[5]，这一新模型在跟踪点被遮挡时，依然能够长时间保持丝滑的跟踪效果，表现非常出色。官方还提供了一个在线试用^[6]，体验后我愿称之为最强点跟踪模型。

Suno AI 推出 Suno Scenes：根据视频和图像生成音乐

Suno Scenes^[7] 功能，可以根据图片或视频生成音乐。不过，目前该功能仅支持 Suno 的 iOS 客户端，并且仅在美国地区可用。

comfyui-Fluxtapoz：实现谷歌 RF-Inversion

comfyui-Fluxtapoz^[8] 是一个实现了昨天介绍的《谷歌 RF-Inversion：增强版 IpAdapter^[9]》的 Comfyui 插件。作者表示目前还是 WIP 阶段，距离论文的效果还差点，若有问题会继续更新。

❝
如果你喜欢《一觉醒来 AI 界发生了什么》系列的话，请关注、点赞、在看、收藏、分享五连警告，这对我真的很重要！

Reference

[1]

Les Ministraux 官方公告: https://mistral.ai/news/ministraux/

[2]

4 种新的视频特效: https://x.com/pika_labs/status/1846295401491845213

[3]

Open-Sora-Plan 项目主页: https://github.com/PKU-YuanGroup/Open-Sora-Plan

[4]

Report-v1.3.0 文档: https://github.com/PKU-YuanGroup/Open-Sora-Plan/blob/main/docs/Report-v1.3.0.md

[5]

CoTracker3 官方网站: https://cotracker3.github.io/

[6]

CoTracker3 在线试用: https://huggingface.co/spaces/facebook/cotracker

[7]

Suno AI 的 Suno Scenes 功能: https://x.com/suno_ai_/status/1846574384963633345

[8]

comfyui-Fluxtapoz 插件: https://github.com/logtd/ComfyUI-Fluxtapoz

[9]

谷歌 RF-Inversion：增强版 IpAdapter 论文: https://sanhua.himrr.com/news/cece0867-92d7-4bc6-b0b1-0d18bc28f1f4

阅读原文

跳转微信打开