橘子汽水铺 03月20日
一句话改图的魔法:Gemini 2.0 Flash和字节 SeedEdit 对比评测
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章对Google的Gemini 2.0 Flash与即梦/豆包里SeedEdit的改图能力进行了10组测试,包括给线稿上色、人物改造等,展示了两个模型的特点,并提供了上手使用指南。

🎨Gemini 2.0 Flash能精准理解指令,但绘图美学较弱且安全审查严格。

💡即梦/豆包SeedEdit创造性强,局部控制能力不错,但有时会画蛇添足。

🔍进行了10组改图测试,如给钢铁侠线稿上色、雪王改造等。

📋提供了两个模型的上手使用指南及相关网址。

原创 orangesai 2025-03-18 18:21 北京

我们再也不需要 P 图大神了吗?

很久以前,有个特别火的百度贴吧,里面潜伏着一堆 P 图大神。

不管发帖的人有怎样的需求,P 图大佬都可以满足他们的愿望。

而今天 AI 进步神速,最近 Google 的 Gemini 2.0 Flash 正式发布,已经能做到一句话改图了。

群友还发现字节去年发布的一句话改图模型 SeedEdit,也已经实装到了即梦和豆包里。

彻底实现了 P 图自由。

我们终于能做到言出法随,再也不需要 P 图大神了吗?

这两天我用 Gemini 2.0 Flash 和即梦「智能参考」、豆包的「图像生成」分别做了 10 组测试,让我们一起来看看 AI 的改图能力到底如何。


以下 10 组测试的顺序都是一样的: 

Prompt + 原图,Gemini 2.0 Flash,即梦/豆包

图片都可以点击放大查看细节。


1.给线稿上色

Prompt:给钢铁侠的线稿上色

两个模型都完成了任务,特别是人物姿势完美还原,非常不错。

在风格方面,左边 Gemini 这个上色属于基础款,右边即梦的上色属于土豪金至尊版,更为加分。


2.蜜雪冰城雪王改造

Prompt:雪王的背景换成绿色,然后在肚子上画一颗爱心

左边 Gemini 把背景换成了新鲜的草绿色,画了一个大大的爱心,线条的质感感和原版很接近。

右边即梦把梦境换成了深绿色,在肚子上画了一个相对标准的爱心,但把雪王的舌头给去掉了,属于有点画蛇添足。


3.Monica 变瘦

一开始我让模型把图片中的人物变瘦一点,即梦完成了任务,但是 Gemini 直接拒绝了我,说瘦是一种不正确的审美。。。这个模型在测试中安全做的太过严苛了,非常影响效率

于是我把 Prompt 换成了:把图片中的人物变年轻一点。

左边的 Gemini 对年轻的理解,让我有点难以理解,看来 P 人还是不要找它了。

右边的即梦,很年轻很精神,同时也瘦了。


4.Joey 眼球变大

Prompt:眼球变成乒乓球

左边 Gemini 直接贴了两个乒乓球上去。

右边即梦把眼球放大到乒乓球大小。

这组很难评价,即梦稍好一些。。。


5.拿机关枪的蒙娜丽莎

Prompt:人物姿势换成拿机关枪

Gemini 直接换了个人,在人物方面未能保持一致性。

即梦完成了任务,同时把蒙娜丽莎温柔慈祥的表情改得更加坚定了一些。


6.i坤的啦啦队

Prompt:背景加上啦啦队

Gemini 添加的啦啦队很整齐,但同时改变了i坤的姿势是扣分项。

豆包保留了i坤的姿势,但啦啦队加的属实随意了一些。。。


7.神奈川冲浪里的猫船

Prompt:在波浪之中画一只猫船

左边 Gemini 画了一只猫,但是没有船,而且这个猫的脸有点抽象。

右边即梦完美地画完成了任务,配色和图像也保持了一致性。

8.Moss 换背景

Prompt:把背景换成雪山

Gemini 把任务完成的非常好,几乎完美地保留了 Moss 的所有细节,这个还原性给个高分。

即梦对Moss进行了一定的重新绘制,虽然好看,但不够还原。


9.表情包 3D 化测试

Prompt:把这张图重绘成3D高清版本


这道题其实非常难,原图就不太正常,非常考验模型的想象力。

Gemini 把表情包还原成了一个可爱的小熊猫形象,气质不符。

即梦把表情包还原成了一个有点中年感的熊猫形象,同时保留了文字,要是表情再和原图对齐一下就更好了。


10.梗图测试

Prompt:把右边女生的表情换成微笑

Gemini 替换了修改了右侧女生的嘴形,确实是在笑,但是眼神没改,笑里透着一丝的白眼。

即梦里的女生笑得是真开心了,不过中间的男生怎么也跟着笑了,再一次画蛇添足。


两个模型的特点总结:

经过以上 10 组测试,我们对 Google 的 Gemini 2.0 Flash 与即梦/豆包里 SeedEdit 两个模型的一句话改图能力,有了非常直观的感受。

现在来做个总结:


Gemini 2.0 Flash 核心特点

1.对图像和指令的理解更强,在 Moss 测试、替换女生表情的测试方面,明显感觉到 Gemini 对指令的理解是更精准的。

2.图像的美学弱一些,从钢铁侠的上色能看出来,模型的绘图美学比较弱一些。

3.安全审查过于严格,连瘦脸都不行,这价值观实在太过了。


即梦/豆包 SeedEdit 核心特点

1.创造性更强,在钢铁侠、蒙娜丽莎机关枪、表情包3D化的案例中,都表现出了更强的创造力

2.局部控制能力强,比如蒙娜丽莎的姿势变化,眼球的变化,都体现出了很不错的控制力

3.有时候会画蛇添足,比如修改指令外的人物、去掉雪王的舌头,这里的进步空间还挺大


上手使用指南:

看完上面的对比之后,你是不是也想自己试试看了?

目前一句话改图是可以免费体验的,体验的方式如下:

Google Gemini 2 Flash

网络在美国的朋友们,可以访问官网使用,模型特别注意一定要选择第二个

官网: http://aistudio.google.com/

即梦 AI

即梦可以在官网使用,也可以在应用商店下载即梦APP直接使用。

在使用时,导入参考图后选择「智能参考」即可。

官网:https://jimeng.jianying.com/


豆包

豆包可以在桌面端或者手机端的豆包 APP 直接使用。

使用时,先选择【图像生成】功能,然后点击【参考图】按钮,把原图导入即可。

官网: https://www.doubao.com/

好了,以上就是今天评测的全部内容。

感谢阅读,我们下次再见。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.0 Flash 即梦/豆包SeedEdit AI改图 模型特点
相关文章