原创 orangesai 2025-03-18 18:21 北京
我们再也不需要 P 图大神了吗?
很久以前,有个特别火的百度贴吧,里面潜伏着一堆 P 图大神。
不管发帖的人有怎样的需求,P 图大佬都可以满足他们的愿望。
而今天 AI 进步神速,最近 Google 的 Gemini 2.0 Flash 正式发布,已经能做到一句话改图了。
群友还发现字节去年发布的一句话改图模型 SeedEdit,也已经实装到了即梦和豆包里。
彻底实现了 P 图自由。
我们终于能做到言出法随,再也不需要 P 图大神了吗?
这两天我用 Gemini 2.0 Flash 和即梦「智能参考」、豆包的「图像生成」分别做了 10 组测试,让我们一起来看看 AI 的改图能力到底如何。
以下 10 组测试的顺序都是一样的:
Prompt + 原图,Gemini 2.0 Flash,即梦/豆包
图片都可以点击放大查看细节。
1.给线稿上色
Prompt:给钢铁侠的线稿上色
两个模型都完成了任务,特别是人物姿势完美还原,非常不错。
在风格方面,左边 Gemini 这个上色属于基础款,右边即梦的上色属于土豪金至尊版,更为加分。
2.蜜雪冰城雪王改造
Prompt:雪王的背景换成绿色,然后在肚子上画一颗爱心
左边 Gemini 把背景换成了新鲜的草绿色,画了一个大大的爱心,线条的质感感和原版很接近。
右边即梦把梦境换成了深绿色,在肚子上画了一个相对标准的爱心,但把雪王的舌头给去掉了,属于有点画蛇添足。
3.Monica 变瘦
一开始我让模型把图片中的人物变瘦一点,即梦完成了任务,但是 Gemini 直接拒绝了我,说瘦是一种不正确的审美。。。这个模型在测试中安全做的太过严苛了,非常影响效率
于是我把 Prompt 换成了:把图片中的人物变年轻一点。
左边的 Gemini 对年轻的理解,让我有点难以理解,看来 P 人还是不要找它了。
右边的即梦,很年轻很精神,同时也瘦了。
4.Joey 眼球变大
Prompt:眼球变成乒乓球
左边 Gemini 直接贴了两个乒乓球上去。
右边即梦把眼球放大到乒乓球大小。
这组很难评价,即梦稍好一些。。。
5.拿机关枪的蒙娜丽莎
Prompt:人物姿势换成拿机关枪
Gemini 直接换了个人,在人物方面未能保持一致性。
即梦完成了任务,同时把蒙娜丽莎温柔慈祥的表情改得更加坚定了一些。
6.i坤的啦啦队
Prompt:背景加上啦啦队
Gemini 添加的啦啦队很整齐,但同时改变了i坤的姿势是扣分项。
豆包保留了i坤的姿势,但啦啦队加的属实随意了一些。。。
7.神奈川冲浪里的猫船
Prompt:在波浪之中画一只猫船
左边 Gemini 画了一只猫,但是没有船,而且这个猫的脸有点抽象。
右边即梦完美地画完成了任务,配色和图像也保持了一致性。
8.Moss 换背景
Prompt:把背景换成雪山
Gemini 把任务完成的非常好,几乎完美地保留了 Moss 的所有细节,这个还原性给个高分。
即梦对Moss进行了一定的重新绘制,虽然好看,但不够还原。
9.表情包 3D 化测试
Prompt:把这张图重绘成3D高清版本
这道题其实非常难,原图就不太正常,非常考验模型的想象力。
Gemini 把表情包还原成了一个可爱的小熊猫形象,气质不符。
即梦把表情包还原成了一个有点中年感的熊猫形象,同时保留了文字,要是表情再和原图对齐一下就更好了。
10.梗图测试
Prompt:把右边女生的表情换成微笑
Gemini 替换了修改了右侧女生的嘴形,确实是在笑,但是眼神没改,笑里透着一丝的白眼。
即梦里的女生笑得是真开心了,不过中间的男生怎么也跟着笑了,再一次画蛇添足。
两个模型的特点总结:
经过以上 10 组测试,我们对 Google 的 Gemini 2.0 Flash 与即梦/豆包里 SeedEdit 两个模型的一句话改图能力,有了非常直观的感受。
现在来做个总结:
Gemini 2.0 Flash 核心特点
1.对图像和指令的理解更强,在 Moss 测试、替换女生表情的测试方面,明显感觉到 Gemini 对指令的理解是更精准的。
2.图像的美学弱一些,从钢铁侠的上色能看出来,模型的绘图美学比较弱一些。
3.安全审查过于严格,连瘦脸都不行,这价值观实在太过了。
即梦/豆包 SeedEdit 核心特点
1.创造性更强,在钢铁侠、蒙娜丽莎机关枪、表情包3D化的案例中,都表现出了更强的创造力
2.局部控制能力强,比如蒙娜丽莎的姿势变化,眼球的变化,都体现出了很不错的控制力
3.有时候会画蛇添足,比如修改指令外的人物、去掉雪王的舌头,这里的进步空间还挺大
上手使用指南:
看完上面的对比之后,你是不是也想自己试试看了?
目前一句话改图是可以免费体验的,体验的方式如下:
Google Gemini 2 Flash
网络在美国的朋友们,可以访问官网使用,模型特别注意一定要选择第二个
官网: http://aistudio.google.com/
即梦 AI
即梦可以在官网使用,也可以在应用商店下载即梦APP直接使用。
在使用时,导入参考图后选择「智能参考」即可。
官网:https://jimeng.jianying.com/
豆包
豆包可以在桌面端或者手机端的豆包 APP 直接使用。
使用时,先选择【图像生成】功能,然后点击【参考图】按钮,把原图导入即可。
好了,以上就是今天评测的全部内容。
感谢阅读,我们下次再见。