Midjourney入局视频生成，图像模型V7不断更新，视觉卷王实锤了

硅星人Pro 06月18日 01:57

Midjourney入局视频生成，图像模型V7不断更新，视觉卷王实锤了

Midjourney，以其强大的图像生成能力闻名，现已涉足视频生成领域。新模型展示了流畅的人物动作、逼真的细节纹理和视角切换效果，引发广泛关注。尽管模型尚未正式发布，但其在物理真实感和动作流畅度上的表现已令人印象深刻。同时，Midjourney的图像模型V7也在不断更新，带来了语音生图的“草稿模式”和加速功能，进一步提升了生成速度和用户体验。Midjourney正在积极完善视频模型，并寻求用户反馈以优化定价策略，持续保持其在图像生成领域的领先地位。

🎬 Midjourney推出了视频生成模型，展示了流畅的人物动作、逼真的细节纹理和视角切换效果，但目前尚不具备音频功能。

✨ 视频模型在物理真实感、纹路细节和动作平滑度上表现出色，引发了用户对与现有视频生成模型差异性的讨论。

🗣️ Midjourney的图像模型V7也在不断更新，推出了“草稿模式”，支持语音生图，并通过加速功能提升了图像生成速度。

💰 为了更好地满足用户需求，Midjourney团队正在积极收集用户对定价的建议，并鼓励用户参与视频评分，以完善模型。

2025-06-17 09:52 上海

图像生成界的“大魔王”Midjourney也来卷视频生成了？！

文章转载于量子位（QbitAI）作者：闻乐

图像生成界的“大魔王”Midjourney也来卷视频生成了？！

上面展示的就是一个视频效果。

可以看到跑步动作和人物、空间转换非常丝滑。

下面这个挖蛋糕的场景不仅逼真，勺子上还有倒影，非常细节了。

一石激起千层浪，消息一出，Reddit点赞量直达2.5k。

还引发了网友们激烈讨论。

有人说“这是第一次以为是人工拍摄的视频”、“几乎和现实无法区分”。

不仅视频模型表现良好，Midjourney的图像模型V7也在不断更新中。

1

不仅效果惊人，价格还由你来定

再来看看更多的效果演示。

多人物动作和视角切换也非常丝滑。

小猫的动作和人手的动作都很有物理真实感。

小狗滑滑板来了～

汽车漂移也不在话下。

小猫美甲确实很精细，但更细节的是手部的纹路，手指上居然还有指纹（虽然有一部分指纹是缺失的）。

不过，也正如上面那位网友所说，有些地方还是不太合理的。

比如，这个叠毯子的场景中，虽然考虑到了手部发力扯出的褶皱，给人一定的物理真实感，但是后面像是毯子自己缩回去了……

还有这个，怎么感觉是爬了一段无意义的楼梯，而且女人右手上的花突然飘到了左手上，就为了右手能搭上楼梯。

总体看下来，Midjourney的这个视频生成模型在物理真实感、纹路细节、动作平滑程度上表现还是很不错的。

但是，如果看过之前Veo 3的效果，你会不会觉得Midjourney这些视频哪里有点问题——

没有音频功能。

是的，网友们也发现了这一点。

同样是拉小提琴，Midjourney这边只有后期加的音乐。

而Veo 3却可以生成小提琴的琴声。

于是，就有人提出质疑了，Midjourney这时候入局是不是有点晚了？

不过，就在前两天，Midjourney公开进行了公司会议，展示了部分视频生成的演示，并且提到了“动画化图片”，似乎是与其他视频生成模型相区别的功能。

实际上，相比于写实风格，动画风才是Midjourney更擅长的。

目前，Midjourney的视频模型还没有正式发布，正在做最后的完善。

团队呼吁大家积极参加视频评分，以帮助模型学习人们在视频中喜欢看到的动作和构图组合。

并且，Midjourney还非常有诚意地表示，希望大家给些建议，让定价能够满足每个人的需求。

不得不说，这波操作也是非常有诚意了。

1

Midjourney V7支持语音生图

除了视频模型，生图模型Midjourney V7也在不断更新中。

从今年3月份开始，Midjourney不断呼吁用户积极参加图像评分，用来对V7进行最终完善。

在4月份， Midjourney发布了V7 alpha。

有Relax和Turbo模式两个版本。

下面是一些效果图，可以看到，V7生成的手部纹理是非常逼真的。

V7的旗舰功能是“草稿模式”。

在使用这个功能时，提示栏将更改为“对话模式”。

比如，告诉它用猫换隼或让它变成夜晚，它会自动操作提示并开始一项新工作。

点击“草稿模式”然后点击麦克风按钮以启用“语音模式”——你可以大声思考，让图像如梦境一样在生成区流动。

也就是说，通过说话就能生成图像，并且可以生成多图任君选择～

草稿模式让生成成本减半，渲染图像速度提升了10倍。

目前，团队也已经将“草稿模式”与“对话模式“区分开，你可以自由选择如何单独或者组合使用这些功能。

团队还推出V7快速模式，也就是更新了加速的功能。

这意味着在快速模式下模型优化需40秒，在Turbo模式下将仅耗时18秒。

经过团队不断努力，目前，Midjourney V7图像生成速度提升了约40%。

快速模式作业渲染时间从36秒减少到22秒。

Turbo作业渲染时间从13秒减少到9秒。

图像模型V7不断更新，还即将推出视频模型，Midjourney不愧是卷王！

参考链接：[1]https://www.reddit.com/r/singularity/comments/1lbwaek/midjourneys_first_video_model/[2]https://x.com/trbdrk/status/1933992009955455193[3]https://x.com/midjourney/status/1932876980237877754

点个“爱心”，再走吧

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Midjourney 视频生成 AI 图像生成

相关文章

【iThome 2024 CIO大調查系列 1｜CIO年度目標】CIO更重視開創型IT戰略，AI創新優先度今年驟增

How popular is ChatGPT? Part 1: more popular than Taylor Swift

Weka Makes Life Simpler for Developers, Engineers, and Architects

Top 40+ Generative AI Tools in 2024

✨ 人人都能用好AI，这款GPTs 助你定制高效工作流：Prompt for me 作为一个AI布道者，Hans 在即刻写下数百篇新产品介绍、模型研究和心得，却仍感受到不同领域和...

Redundancy in AI: A Hybrid Convolutional Neural Networks CNN Approach to Minimize Computational Overhead in Reliable Execution

OpenAI计划下周宣布ChatGPT和GPT-4更新，但不会推出GPT-5和搜索引擎

Intersect360 Research Takes a Deep Dive into the HPC-AI Market in New Report

Is the Future of Retail AI in the Hands of CTOs?

In the AI Revolution, Real-Time Data Platforms Are the Hidden Drivers of Innovation