Midjourney发布V7版本alpha测试,重点推出“草图模式”,该模式在效率和资源消耗上有所优化。新版本增强了文本理解和细节纹理,提升了人物肢体和物体结构的连贯性。V7默认启用“个性化模型”,学习用户偏好。草图模式支持实时编辑、语音生成和指令扩展,用户可用中文语音创作。尽管草图模式分辨率较低,但其快速迭代和便捷性为用户提供了新的创作可能。Midjourney承诺在未来两个月内频繁更新。
🎨 V7版本增强了文本理解能力,提升了细节纹理质感,人物肢体、手部和物体结构等连贯性都有所提升,这使得生成的图像更具真实感和艺术性。
🤖 V7版本默认启用“个性化模型”功能,该功能能够学习用户的创作偏好,从而实现更精准的创意解读,用户可以随时开关该功能,以适应不同的创作需求。
✍️ 最大的升级是全新的“草图模式”,该模式在耗时与资源消耗方面仅为标准模式的50%。在该模式下,网页端编辑器将自动切换为“对话式交互界面”,支持实时编辑,例如替换物体或调整场景。
🎤 “草图模式”还支持语音识别生成功能。用户只需启用该模式后点击麦克风图标,即可通过语音实时塑造图片,而且该模式支持中文语音指令。
🚀 该模式支持指令扩展,用户可以在提示词后加入“--draft”参数,使用多版本迭代、批量生成等进阶功能。然而,草图模式生成的图片分辨率相对较低,超分、编辑、材质替换等功能仍将调用V6模型,后续将逐步升级。
IT之家 4 月 4 日消息,Midjourney 公司今日于 X 上发文,宣布旗下 AI 图片生成模型开启 V7 版本 alpha 测试,主要更新了“草图模式”。

根据官方介绍,在常规更新方面,V7 版本增强了文本理解能力并升级了细节纹理质感,人物肢体 / 手部 / 物体结构等连贯性都有提升,同时 V7 版本将默认启用“个性化模型”功能,该功能可学习用户偏好,实现更精准的创意解读,用户可随时开关。

本次 V7 版本最大的升级是全新的“草图模式”,该模式在耗时与资源消耗方面仅为标准模式的 50%,在此模式下网页端编辑器将自动切换为“对话式交互界面”,同时可进行实时编辑(如输入“将猫替换成猫头鹰”或“转为夜景”等指令,系统可自动根据提示词调整生成新作品)。

在“草图模式”下,用户还可以使用语音识别生成功能,只需要在启用“草图模式”后点击麦克风图标,即可通过语音实时塑造图片;且该模式还支持指令扩展,只需要在提示词后加入“--draft”参数,即可使用多版本迭代、批量生成等进阶功能。同时根据博主 @歸藏的AI工具箱 测试,该模式下可用中文进行语音识别生图。

IT之家注意到,“草图模式”下生成的图片分辨率相比其他模式较低,且目前超分、编辑、材质替换等功能仍将调用 V6 模型,后续将逐步升级,同时 Midjourney 也承诺未来 60 天内,每 1-2 周发布一次新功能。