三花AI 2024年10月21日
Mistra 推出世界顶级边缘计算小模型;PIKA 全新视频特效;Open-Sora-Plan最新发布;Suno 视频和图生音乐
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文涵盖了AI领域的多项新成果,包括Mistra推出的边缘计算小模型、PIKA AI的全新视频特效、Open-Sora-Plan的改进、CoTracker3的像素级目标追踪、Suno Scenes的音乐生成功能以及comfyui-Fluxtapoz实现的谷歌RF-Inversion等内容。

🎬Mistra推出世界顶级边缘计算小模型Les Ministraux,包含3B和8B两个版本,在基准测试中表现优异,目前只开源8B模型且仅限研究使用,商用需另行申请。

💥PIKA AI发布4种全新视频特效,分别是碎块、漏气、湮灭和消失,此前的融化、爆炸、挤压特效曾受欢迎,此次新特效令人期待。

📄Open-Sora-Plan v1.3.0发布,带来五大显著改进,包括高性能WFVAEPrompt Refiner优化、短提示词输入、高质量数据清理策略、DiT优化动态分辨率和动态持续时间。

👀Meta AI推出CoTracker3,在跟踪点被遮挡时仍能长时间保持丝滑跟踪效果,官方提供在线试用,被赞为最强点跟踪模型。

🎵Suno AI推出Suno Scenes,可根据视频和图像生成音乐,但目前仅支持Suno的iOS客户端且仅在美国地区可用。

🛠comfyui-Fluxtapoz是实现谷歌RF-Inversion的Comfyui插件,作者表示目前处于WIP阶段,距论文效果尚有差距,会持续更新。

原创 小茸茸 2024-10-17 09:23 重庆

PIKA AI 全新视频特效;Open-Sora-Plan v1.3.0 改进;CoTracker3实现丝滑的像素级目标追踪;Suno Scenes根据视频和图像生成音乐;comfyui-Fluxtapoz实现谷歌 RF-Inversion

Mistra 推出世界顶级边缘计算小模型

Les Ministraux[1] 官方宣称其边缘模型为世界上最好的,包含 3B 和 8B 两个版本,在各种基准测试中均超越了 Llama 3.2 和 Gemma 2 的同参数量模型。这次只开源了 8B 模型,但仅限研究使用,商用需另行申请。

PIKA AI 发布 4 种全新视频特效

PIKA AI 昨晚公布了 4 种新的视频特效[2],分别是碎块、漏气、湮灭和消失。上次发布的融化、爆炸、挤压特效曾风靡一时,不知这次会不会又擦出火花。

Open-Sora-Plan v1.3.0 发布:五大改进

Open-Sora-Plan[3] 昨晚发布了 v1.3.0,新版本带来了五大显著改进:

    高性能 WFVAE

    Prompt Refiner 优化短提示词输入

    高质量的数据清理策略

    DiT 优化

    动态分辨率和动态持续时间此外,作者在 B 站发布了一个《黑神话悟空第三结局AI创意短片》演示视频,虽然离商业模型还有很大差距,但展示了项目的潜力。完整改动和细节介绍可以查看 Report-v1.3.0[4]

Meta AI 推出 CoTracker3:实现丝滑的像素级目标追踪

Meta AI 在 CoTracker 的基础上,推出了 CoTracker3[5],这一新模型在跟踪点被遮挡时,依然能够长时间保持丝滑的跟踪效果,表现非常出色。官方还提供了一个在线试用[6],体验后我愿称之为最强点跟踪模型。

Suno AI 推出 Suno Scenes:根据视频和图像生成音乐

Suno Scenes[7] 功能,可以根据图片或视频生成音乐。不过,目前该功能仅支持 Suno 的 iOS 客户端,并且仅在美国地区可用。

comfyui-Fluxtapoz:实现谷歌 RF-Inversion

comfyui-Fluxtapoz[8] 是一个实现了昨天介绍的《谷歌 RF-Inversion:增强版 IpAdapter[9]》的 Comfyui 插件。作者表示目前还是 WIP 阶段,距离论文的效果还差点,若有问题会继续更新。


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

现在加入 AI 日报群,不会漏掉消息嗷

Reference

[1]

Les Ministraux 官方公告: https://mistral.ai/news/ministraux/

[2]

4 种新的视频特效: https://x.com/pika_labs/status/1846295401491845213

[3]

Open-Sora-Plan 项目主页: https://github.com/PKU-YuanGroup/Open-Sora-Plan

[4]

Report-v1.3.0 文档: https://github.com/PKU-YuanGroup/Open-Sora-Plan/blob/main/docs/Report-v1.3.0.md

[5]

CoTracker3 官方网站: https://cotracker3.github.io/

[6]

CoTracker3 在线试用: https://huggingface.co/spaces/facebook/cotracker

[7]

Suno AI 的 Suno Scenes 功能: https://x.com/suno_ai_/status/1846574384963633345

[8]

comfyui-Fluxtapoz 插件: https://github.com/logtd/ComfyUI-Fluxtapoz

[9]

谷歌 RF-Inversion:增强版 IpAdapter 论文: https://sanhua.himrr.com/news/cece0867-92d7-4bc6-b0b1-0d18bc28f1f4


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Mistra PIKA AI Open-Sora-Plan CoTracker3 Suno Scenes comfyui-Fluxtapoz
相关文章