快科技资讯 2024年12月16日
Gemini 2.0成P图神器 各种P图只需一句话的事儿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌Gemini 2.0的图像编辑功能近期引发热议,其强大的多模态能力允许用户通过文字指令直接修改图片。用户可以轻松地将汽车改装成敞篷车,或在车内添加海滩用品,甚至改变车身颜色,并能一步步图文并茂地展示修改过程。此外,Gemini 2.0还能同时编辑图片中的多个元素,将一个物件变成另一个,例如把夹克变成枕头,或将猫与滑板结合。其强大的图像理解能力,允许用户圈出图片中的特定区域进行编辑,甚至能将箱子打开或让汽车飞起来。据悉,该功能将于明年年初更广泛地推出。

🖼️ Gemini 2.0 具备强大的多模态能力,能够理解文字指令并将其应用于图像编辑,实现一键P图,例如将汽车改为敞篷车,并能保持其他元素的一致性。

🎨 Gemini 2.0 可以根据指令逐步修改图像,例如将汽车颜色改为夏日色调,并在车内添加海滩用品,同时图文并茂地展示修改过程,体现了其强大的推理和生成能力。

✨ Gemini 2.0 不仅能修改单一元素,还能同时编辑图片中的多个元素,将一个物件变成另一个,例如夹克变枕头,猫与滑板结合,并能根据文字指令将猫变成插画贴纸形态。

🧰 Gemini 2.0 还能基于图像内容进行更具想象力的编辑,例如将箱子打开,将汽车变成飞车,甚至允许用户圈出图像中的特定区域进行编辑,并理解“this”的指代。

Gemini 2.0说说话就能一键 P 图的功能爆火,把玩不了的大伙儿都馋哭了!

比如一辆小车车:

输入指令 " 把这辆车改装成敞篷车 ",它就能立马将文字指令和图片结合起来,完成一键 P 图。

让我们来找茬儿,发现除了车变成了敞篷的,其它元素木有变化,很好地保持了一致性

不仅于此,Gemini 2.0 还有点 " 多模态版 o1" 那味儿。

继续输入指令:想象一下,这辆车内装满了海滩用品。接着,将车身颜色改为一种令人联想到夏日的颜色,并在改变过程中进行说明。

然后 Gemini 2.0 就开始图文并茂地一步步推理生成了,先把车变成了明亮的黄色,接着又再车里装满了遮阳伞等海滩用品

这就是 Gemini 2.0 系列的原生图像输出能力。

评论区底下,一水儿都是求具体上线时间的:

被谷歌挖走的 OpenAI 大将 Logan Kilpatrick 回应,大伙儿别急,明年年初将更广泛地推出。

除了上面展示的简单 P 图,你甚至可以同时 P 图片中的多个元素,还能把一个物件变成另一个

比如,把蓬松的夹克变成一个小枕头,并且拿掉毯子:

这还没完,结合不同的图来 P也行。

猫和抱枕结合,就得到了一个很有质感的猫猫抱枕:

把猫猫和滑板结合就得到了猫猫代言滑板。

遵从文字指令,Gemini 2.0 成功将猫猫变成了插画贴纸形态。

除此之外,Gemini 2.0 P 图时还能更有想象力

比如一个箱子,把箱子打开就变成了酱婶儿:

开头展示的小车车,也能变成 " 飞车 ":

另外,还有一种玩法。

在图像中圈出需要 P 的区域,只需 "Open this",Gemini 2.0 可以直接结合文字指令理解图像,知道 "this" 的指代:

不得不说,那些有内测资格的玩家,可算了把大伙儿馋坏了。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini 2.0 图像编辑 多模态 一键P图 AI
相关文章