Gemini 2.0成P图神器各种P图只需一句话的事儿

快科技资讯 2024年12月16日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

谷歌Gemini 2.0的图像编辑功能近期引发热议，其强大的多模态能力允许用户通过文字指令直接修改图片。用户可以轻松地将汽车改装成敞篷车，或在车内添加海滩用品，甚至改变车身颜色，并能一步步图文并茂地展示修改过程。此外，Gemini 2.0还能同时编辑图片中的多个元素，将一个物件变成另一个，例如把夹克变成枕头，或将猫与滑板结合。其强大的图像理解能力，允许用户圈出图片中的特定区域进行编辑，甚至能将箱子打开或让汽车飞起来。据悉，该功能将于明年年初更广泛地推出。

🖼️ Gemini 2.0 具备强大的多模态能力，能够理解文字指令并将其应用于图像编辑，实现一键P图，例如将汽车改为敞篷车，并能保持其他元素的一致性。

🎨 Gemini 2.0 可以根据指令逐步修改图像，例如将汽车颜色改为夏日色调，并在车内添加海滩用品，同时图文并茂地展示修改过程，体现了其强大的推理和生成能力。

✨ Gemini 2.0 不仅能修改单一元素，还能同时编辑图片中的多个元素，将一个物件变成另一个，例如夹克变枕头，猫与滑板结合，并能根据文字指令将猫变成插画贴纸形态。

🧰 Gemini 2.0 还能基于图像内容进行更具想象力的编辑，例如将箱子打开，将汽车变成飞车，甚至允许用户圈出图像中的特定区域进行编辑，并理解“this”的指代。

Gemini 2.0说说话就能一键 P 图的功能爆火，把玩不了的大伙儿都馋哭了！

比如一辆小车车：