三花AI 前天 10:40
小红书流量密码,英语语法讲解;Midjourney 更新图片编辑器;阿里开源首尾帧生成视频模型;字节开源多模态GUI自动化智能体
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文汇总了近期AI领域的重要更新和开源项目。Midjourney的图片编辑器新增多图层和智能对象选择功能,V7模型也支持Weird参数。小视频宝发布AI语法讲解视频模板,方便用户制作讲解视频。阿里开源了Wan2.1-FLF2V,一个基于首尾帧生成视频的14B模型。字节跳动开源UI-TARS-1.5,一个多模态GUI自动化智能体,在GUI自动化方面表现出色。这些更新和开源项目展示了AI技术的快速发展和在图像编辑、视频生成和GUI自动化等领域的应用。

🖼️ Midjourney 图片编辑器更新:新增多图层和智能对象选择功能,会员专享。同时,v7模型现已支持Weird参数,增强图片创作的创意性。

📹 小视频宝发布AI语法讲解视频模板:该模板能自动生成语法题目并完成语音讲解视频,为用户提供便捷的视频创作工具。

🎬 阿里开源 Wan2.1-FLF2V 模型:这是一个基于首尾帧生成视频的14B模型,支持最高720p输出。用户可在官方wan.video平台体验Image2Video模式。

🤖 字节跳动开源 UI-TARS-1.5:一款多模态 AI 智能体,专注于 GUI 自动化。它能够操作桌面应用、浏览器,甚至实现游戏自动化,在GUI代理的基准测试中表现出色,超越了OpenAI Operator 和 Claude 3.7。

原创 小茸茸 2025-04-21 09:35 重庆

Midjourney 更新图片编辑器:支持智能对象选择;小视频宝发布AI语法讲解视频模板;阿里开源 Wan2.1-FLF2V:首尾帧生成视频的 14B 模型;字节开源 UI-TARS-1.5:多模态 GUI 自动化智能体

Midjourney 更新图片编辑器:支持智能对象选择

Midjourney[1] 对其图片编辑器进行了更新,新增了多图层和智能对象选择等功能。目前仅对会员开放。

对了,现在 v7模型也支持 Weird 参数了,可以让生成的图片更有创意。

Midjourney 官方推文: https://x.com/midjourney/status/1913032548114137134

小视频宝发布AI语法讲解视频模板

小视频宝[2]最新推出了又一款小红书爆款语法讲解视频模板。能够自动生成语法题目,并完成语音讲解视频。

小视频宝官网: https://clipturbo.himrr.com/

阿里开源 Wan2.1-FLF2V:首尾帧生成视频的 14B 模型

Wan2.1-FLF2V[3]是阿里通义实验室最新开源的视频生成模型,这是一个支持通过首尾帧来生成视频的 14B 模型,最高支持 720p 输出。

佬们现在就可以在官方 wan.video[4] 平台切换到 Image2Video 模式直接使用!

Wan2.1-FLF2V 模型主页: https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P
wan.video 视频创作平台: https://wan.video/wanxiang/videoCreation

字节开源 UI-TARS-1.5:多模态 GUI 自动化智能体

字节跳动开源的 UI-TARS-1.5[5] 是一款基于视觉语言模型的多模态 AI 智能体,专注于 GUI 自动化领域。

能够操作桌面应用、浏览器,甚至实现游戏自动化。

从官方演示来看,效果还是相当不错的。在 GUI 代理的各种基准测试任务上的表现超越了 OpenAI Operator 和 Claude 3.7。

字节跳动开源项目主页: https://github.com/bytedance/UI-TARS

如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要



阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Midjourney AI 视频生成 GUI自动化 开源
相关文章