小红书流量密码，英语语法讲解;Midjourney 更新图片编辑器;阿里开源首尾帧生成视频模型;字节开源多模态GUI自动化智能体

三花AI 前天 10:40

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

本文汇总了近期AI领域的重要更新和开源项目。Midjourney的图片编辑器新增多图层和智能对象选择功能，V7模型也支持Weird参数。小视频宝发布AI语法讲解视频模板，方便用户制作讲解视频。阿里开源了Wan2.1-FLF2V，一个基于首尾帧生成视频的14B模型。字节跳动开源UI-TARS-1.5，一个多模态GUI自动化智能体，在GUI自动化方面表现出色。这些更新和开源项目展示了AI技术的快速发展和在图像编辑、视频生成和GUI自动化等领域的应用。

🖼️ Midjourney 图片编辑器更新：新增多图层和智能对象选择功能，会员专享。同时，v7模型现已支持Weird参数，增强图片创作的创意性。

📹 小视频宝发布AI语法讲解视频模板：该模板能自动生成语法题目并完成语音讲解视频，为用户提供便捷的视频创作工具。

🎬 阿里开源 Wan2.1-FLF2V 模型：这是一个基于首尾帧生成视频的14B模型，支持最高720p输出。用户可在官方wan.video平台体验Image2Video模式。

🤖 字节跳动开源 UI-TARS-1.5：一款多模态 AI 智能体，专注于 GUI 自动化。它能够操作桌面应用、浏览器，甚至实现游戏自动化，在GUI代理的基准测试中表现出色，超越了OpenAI Operator 和 Claude 3.7。

原创小茸茸 2025-04-21 09:35 重庆

Midjourney 更新图片编辑器：支持智能对象选择;小视频宝发布AI语法讲解视频模板;阿里开源 Wan2.1-FLF2V：首尾帧生成视频的 14B 模型;字节开源 UI-TARS-1.5：多模态 GUI 自动化智能体

Midjourney 更新图片编辑器：支持智能对象选择

Midjourney^[1] 对其图片编辑器进行了更新，新增了多图层和智能对象选择等功能。目前仅对会员开放。

对了，现在 v7模型也支持 Weird 参数了，可以让生成的图片更有创意。

Midjourney 官方推文: https://x.com/midjourney/status/1913032548114137134

小视频宝发布AI语法讲解视频模板

小视频宝^[2]最新推出了又一款小红书爆款语法讲解视频模板。能够自动生成语法题目，并完成语音讲解视频。

小视频宝官网: https://clipturbo.himrr.com/

阿里开源 Wan2.1-FLF2V：首尾帧生成视频的 14B 模型

Wan2.1-FLF2V^[3]是阿里通义实验室最新开源的视频生成模型，这是一个支持通过首尾帧来生成视频的 14B 模型，最高支持 720p 输出。

佬们现在就可以在官方 wan.video^[4] 平台切换到 Image2Video 模式直接使用！

Wan2.1-FLF2V 模型主页: https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P
wan.video 视频创作平台: https://wan.video/wanxiang/videoCreation

字节开源 UI-TARS-1.5：多模态 GUI 自动化智能体

字节跳动开源的 UI-TARS-1.5^[5] 是一款基于视觉语言模型的多模态 AI 智能体，专注于 GUI 自动化领域。

能够操作桌面应用、浏览器，甚至实现游戏自动化。

从官方演示来看，效果还是相当不错的。在 GUI 代理的各种基准测试任务上的表现超越了 OpenAI Operator 和 Claude 3.7。

字节跳动开源项目主页: https://github.com/bytedance/UI-TARS

❝
如果你喜欢《一觉醒来 AI 界发生了什么》系列的话，请关注、点赞、在看、收藏、分享五连警告，这对我真的很重要！

阅读原文

跳转微信打开

Midjourney 更新图片编辑器：支持智能对象选择

小视频宝发布AI语法讲解视频模板

阿里开源 Wan2.1-FLF2V：首尾帧生成视频的 14B 模型

字节开源 UI-TARS-1.5：多模态 GUI 自动化智能体

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签