量子位 05月30日 16:56
AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

FLUX.1 Kontext是Black Forest Labs推出的新型AI图像生成和编辑模型,采用流匹配架构,在上下文生成和编辑方面实现了突破。它具备角色一致性、局部编辑、风格参考和交互速度快的特性。Replicate的测试表明,其效果优于OpenAI的GPT-4o,且成本更低。该模型提供专业版、最高配版和开放权重版,并推出了官方试玩平台Flux Playground,用户可通过详细的提示词技巧实现精准的图像编辑和风格迁移。

🎨FLUX.1 Kontext采用流匹配架构,不再依赖传统的文本编码器和扩散模型,实现了真正的上下文生成和编辑,使得模型能同时接受文本和图像输入,提升了图像处理的效率和质量。

🧑‍🎨该模型具备强大的编辑能力,例如在奥特曼照片上添加小绿龙,以及生成猩猩打羽毛球等细节丰富的图像,展示了其在角色一致性和细节处理方面的优势。

💡Replicate的测试表明,FLUX.1 Kontext在图像生成效果上优于GPT-4o,且成本更低,同时测试报告还提供了详细的提示词技巧,帮助用户更好地利用该模型进行图像编辑和风格迁移。

🖼️用户可以通过Flux Playground在线试玩平台体验FLUX.1 Kontext的专业版和最高配版,同时开放权重版也提供内测,为开发者提供了更多探索和定制的可能性。

关注前沿科技 2025-05-30 13:01 北京

比GPT-4o更好更便宜

梦晨 发自 凹非寺量子位 | 公众号 QbitAI

AI生图新突破!一个模型同时接受文本和图像输入。

新模型FLUX.1 Kontext使用流匹配架构(Flow Matching),不再是文本编码器和扩散模型各干各的,与此前技术都不同。

最来自之前很火的Black Forest Labs,官方表示这一次能做到真正的上下文生成和编辑。

在编辑能力上,有人在著名的奥特曼尴尬照上P了一个小绿龙。

在生成能力上,有网友测试的猩猩打羽毛球细节也很丰富。

具体来说FLUX.1 Kontext有4个特性:

这次提供两种模型,专业版FLUX.1 Kontext [pro]更适合快速迭代,可基于之前的编辑

最高配版FLUX.1 Kontext [max],在遵循提示、文字排版和一致性有所提高。

同时推出官方试玩平台Flux Playground,两种型号都可以选用

此外开放权重版FLUX.1 Kontext [dev]提供内测。

提示词技巧

第三方平台Replicate对FLUX.1 Kontext做了详细测试,结论是比OpenAI的4o效果更好,还更便宜,图像也不会偏黄。

测试报告中还针对不同功能给了提示词技巧。

图像编辑

当编辑人物时,无论改动大小,人物的身份特征都会保留。

对于风格迁移任务,也能保留人物的基本特征。

对于更复杂的更改,例如添加人物或更改背景,需要分几步描述每项修改,只要每次改动不太复杂就可以获得好的效果。

风格迁移

风格迁移任务至少具体到“印象派绘画”或“水彩素描”,带上具体的流派艺术家效果更好,如“文艺复兴”或“20 世纪 60 年代的波普艺术”。

如果风格标签不够精准,那就描述一下关键特征,例如“清晰的笔触、厚重的颜料质感和丰富的色彩深度”。如果想保留某些元素,也需要明确说明,如“保持原始构图”。

总之,描述的越具体效果越好。

文本编辑

支持往图上新增文本、删除文本,甚至定位到已有文本修改。

处理文本时的一些技巧:

此外根据网友测试,FLUX.1 Kontext还可以删除文本,如把电影海报上的字全去掉。

角色一致性

在连续编辑时,首先要明确人物,然后说明哪些方面发生了变化,无论是场景、活动还是风格。

如果想让同一个人物继续存在,需要说明哪些方面需要保留:面部、表情、服饰或其他任何重要方面。

在编辑背景和场景的同时保持角色的一致性需要详细描述,以保持人物处于相同的位置、比例或姿势。

简短的提示有时会留下太多模糊的地方,如“把他挪到沙滩上”,就不如:

将背景换成海滩,同时保持人物位置不变,保持相同的主体位置、拍摄角度、取景和视角。只需替换人物周围的环境即可。

其他技巧

最后,Repilicate还对使用FLUX.1 Kontext的提示词技巧做了一个总结:

One More Thing

最后再来看一下文生图领域的格局,在AritificialAnalysis的排行榜上,GPT-4o、字节的Seedream 3.0和Recraft V3排名前三。

Black Forest Labs的上一代爆款产品FLUX.1已经相对靠后。

可以期待一下FLUX.1 Kontex的投票结果。

在线试玩https://playground.bfl.ai/image/generate

参考链接:[1]https://x.com/bfl_ml/status/1928143010811748863[2]https://replicate.com/blog/flux-kontext[3]https://huggingface.co/spaces/ArtificialAnalysis/Text-to-Image-Leaderboard

—  —

📪 量子位AI主题策划正在征集中!欢迎参与专题365行AI落地方案,一千零一个AI应或与我们分享你在寻找的AI产品,或发现的AI新动向

💬 也欢迎你加入量子位每日AI交流群,一起来畅聊AI吧~

一键关注 👇 点亮星标

科技前沿进展每日见

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

FLUX.1 Kontext AI图像编辑 流匹配架构 图像生成
相关文章