豆包之前几天更新了图片的超能创意 1.0 模式，试了一次，给我整麻了。图片生成的门槛再次大幅降低，而且效率高了超级多。这个例子，他直接从LLM 模型拿到了这...

即刻AI圈子 21小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

豆包近日更新了图片超能创意1.0模式，大幅降低了图片生成的门槛，并提高了效率。本次升级主要体现在三个方面：智能增强，图像模型可使用LLM的智能，提示词无需过于详细；上下文理解，可以连续对生成的图片进行修改和调整；批量生成，支持批量生成不同比例或风格的图片。测试表明，豆包对提示词的理解和响应非常好，速度快，尤其在生成社交媒体图片和小说分镜方面表现出色，人物形象可以保持一致。

💡智能增强：超能创意1.0版本让图像模型具备了LLM的智能，用户无需编写详细的提示词，模型也能理解并补充常识性内容，例如，根据案例发散出其他的案例，识别logo样机等。

🔄上下文理解：豆包的图片生成功能现在可以记住上次的生成结果，并在此基础上进行修改。用户可以与豆包一起探索和碰撞新的创意，使得创作过程更具互动性。

🚀批量生成：新版本支持批量生成不同比例或风格的图片，用户可以针对同一设计生成不同比例的社交媒体图片，或者基于同一内容生成不同风格的图片，大大提高了创作效率。

🎬小说分镜：豆包现在可以直接从小说内容转换成分镜图片，甚至不需要额外的提示词，这在小说创作和视觉呈现方面具有强大的应用潜力。人物的穿着和形象在连续的分镜中可以保持一致。

豆包之前几天更新了图片的超能创意 1.0 模式，试了一次，给我整麻了。

图片生成的门槛再次大幅降低，而且效率高了超级多。
这个例子，他直接从LLM 模型拿到了这些知识然后还按照要求改了提示词。
太离谱了，而且这十张图片的生成速度比 4o 一张都要快很多。

下面是详细测试👇

我测试完总结了一下这次的升级主要是三个部分：

智能增强：图像模型可以使用 LLM 的智能，提示词可以不用写的很细，一些知识模型自己知道；
上下文理解：你可以连续对生成的图片进行修改和调整；
批量生成：支持批量生成不同的图片，比如不同比例相同提示词的或者相同提示词不同比例的图片。

我们先来看一下批量生成能力：

支持不同内容和比例的批量生成，对提示词的理解和响应都非常好，而且速度非常的快。
你可以让他针对同一个设计生成不同比例的社交媒体图片，也可以基于同一个内容给你不同的风格图片。

智能增强

之前 3.0 图像模型相较于 4o 最大的问题是你的提示词需要写的很细，模型不会联想和获取知识，这次超能创意更新之后这不再是问题。
你可以给他一个案例让他自己发散其他的案例，而且一些常识性内容你不需要说他也知道，看图片的 logo 样机和Q 版茶饮品牌门店例子。

上下文理解

现在豆包的图片生成可以记住上次的东西基于上一张生成的结果进行修改，也可以跟豆包一起探索和碰撞新的创意。
最强的使用场景是直接从小说内容转换分镜图片
甚至不需要说任何提示词只需要提供内容就行，这个太强了。
可以看到下面几个连续的分镜人物的穿着和形象都是可以保持一致的。

好了这次的体验和测试就是这些，希望能够对你有些启发。

功能在豆包左侧导航的图片生成部分使用，如果有超能创意就是可以用了

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签