Midjourney,以其强大的图像生成能力闻名,现已涉足视频生成领域。新模型展示了流畅的人物动作、逼真的细节纹理和视角切换效果,引发广泛关注。尽管模型尚未正式发布,但其在物理真实感和动作流畅度上的表现已令人印象深刻。同时,Midjourney的图像模型V7也在不断更新,带来了语音生图的“草稿模式”和加速功能,进一步提升了生成速度和用户体验。Midjourney正在积极完善视频模型,并寻求用户反馈以优化定价策略,持续保持其在图像生成领域的领先地位。
🎬 Midjourney推出了视频生成模型,展示了流畅的人物动作、逼真的细节纹理和视角切换效果,但目前尚不具备音频功能。
✨ 视频模型在物理真实感、纹路细节和动作平滑度上表现出色,引发了用户对与现有视频生成模型差异性的讨论。
🗣️ Midjourney的图像模型V7也在不断更新,推出了“草稿模式”,支持语音生图,并通过加速功能提升了图像生成速度。
💰 为了更好地满足用户需求,Midjourney团队正在积极收集用户对定价的建议,并鼓励用户参与视频评分,以完善模型。
2025-06-17 09:52 上海
图像生成界的“大魔王”Midjourney也来卷视频生成了?!

文章转载于量子位(QbitAI)作者:闻乐
图像生成界的“大魔王”Midjourney也来卷视频生成了?!
上面展示的就是一个视频效果。
可以看到跑步动作和人物、空间转换非常丝滑。
下面这个挖蛋糕的场景不仅逼真,勺子上还有倒影,非常细节了。
一石激起千层浪,消息一出,Reddit点赞量直达2.5k。
还引发了网友们激烈讨论。
有人说“这是第一次以为是人工拍摄的视频”、“几乎和现实无法区分”。
不仅视频模型表现良好,Midjourney的图像模型V7也在不断更新中。
1
不仅效果惊人,价格还由你来定再来看看更多的效果演示。
多人物动作和视角切换也非常丝滑。
小猫的动作和人手的动作都很有物理真实感。
小狗滑滑板来了~
汽车漂移也不在话下。
小猫美甲确实很精细,但更细节的是手部的纹路,手指上居然还有指纹(虽然有一部分指纹是缺失的)。
不过,也正如上面那位网友所说,有些地方还是不太合理的。
比如,这个叠毯子的场景中,虽然考虑到了手部发力扯出的褶皱,给人一定的物理真实感,但是后面像是毯子自己缩回去了……
还有这个,怎么感觉是爬了一段无意义的楼梯,而且女人右手上的花突然飘到了左手上,就为了右手能搭上楼梯。
总体看下来,Midjourney的这个视频生成模型在物理真实感、纹路细节、动作平滑程度上表现还是很不错的。
但是,如果看过之前Veo 3的效果,你会不会觉得Midjourney这些视频哪里有点问题——
没有音频功能。
是的,网友们也发现了这一点。
同样是拉小提琴,Midjourney这边只有后期加的音乐。
而Veo 3却可以生成小提琴的琴声。
于是,就有人提出质疑了,Midjourney这时候入局是不是有点晚了?
不过,就在前两天,Midjourney公开进行了公司会议,展示了部分视频生成的演示,并且提到了“动画化图片”,似乎是与其他视频生成模型相区别的功能。
实际上,相比于写实风格,动画风才是Midjourney更擅长的。
目前,Midjourney的视频模型还没有正式发布,正在做最后的完善。
团队呼吁大家积极参加视频评分,以帮助模型学习人们在视频中喜欢看到的动作和构图组合。
并且,Midjourney还非常有诚意地表示,希望大家给些建议,让定价能够满足每个人的需求。
不得不说,这波操作也是非常有诚意了。
1
Midjourney V7支持语音生图