量子位 05月08日 15:26
谷歌Gemini火力全开!实测:原生图像生成新升级确实强
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌的Gemini原生图像生成功能近期进行了升级,带来了更优的图像质量、更准确的文本渲染和更快的生成速度。用户现在可以在Google AI Studio免费试用这些新功能,体验丝滑的图像融合和实时编辑。升级后的Gemini在处理图像细节、文字渲染和用户指令方面表现出色,尽管在某些方面可能略逊于GPT-4o。开发者还可以通过Gemini API集成,以较低的成本使用该功能。总的来说,这次升级为用户提供了更强大、更便捷的图像生成工具。

✨ **图像质量提升**:升级后的Gemini在图像质量方面有所提高,能够生成更清晰、更逼真的图像。

✍️ **文本渲染准确**:新版本在文本渲染方面表现出色,能够准确地呈现各种语言的文字,并支持艺术字设计。

🚀 **生成速度加快**:Gemini的图像生成速度显著提升,能够更快地响应用户指令,实现实时编辑。

🎨 **图像融合能力**:该功能可以丝滑地融合两张图片中的元素,实现复杂的图像合成效果。

💡 **实时编辑功能**:用户可以实时编辑图像,例如添加眼镜等元素,并立即看到修改后的效果。

关注前沿科技 2025-05-08 12:08 北京

目前人人都能在谷歌AI Studio免费试玩

一水 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌Gemini原生图像生成功能又双叒升级了!

与之前的实验版本相比(Gemini 2.0 Flash Experimental),这一次主打图像质量更好、文本渲染更准确,生成速度更快。

只需一句话,就能将两张图片中的元素丝滑融合在一起。

还能实时编辑图像,比如刚说完给图中人物加上眼镜,图片立马就生成好了。

p.s. 这个需要在Google AI Studio的Starter Apps板块体验

也可以指定仅修改图中某一部分,新图的其他部分能同时和原来保持一致。

更有意思的是,搭配Gemini 2.0 Flash食用,还能让模型自己构思自己生图。

现在,这些功能都可以在Google AI Studio免费试玩,模型请认准“gemini-2.0-flash-preview-image-generation”

开发者可以通过Google AI Studio和Vertex AI中的Gemini API集成,每张图片的价格为0.039美元(约合人民币0.28元)

实际上,本次升级距离谷歌首次推出Gemini原生图像生成功能,仅过去一个多月时间。

网友们的感受也都体现在了下面这张梗图中:

谷歌最近真是火力全开啊!

实测最新升级

据谷歌AI Studio开发者平台产品负责人透露, 本次升级主要体现在以下几个方面:

那么其实际表现究竟如何呢?我们也第一时间进行了实测。

首先,在谷歌提供的demo中,我们看到了它能很好地将完全不同的元素自然融合在一起。

于是我们也提供了下面两张原图,要求它帮忙生成量子位周边。

实测用时5.4s,几乎一瞬间就生成了我们想要的图片。

尽管logo的颜色还有细微偏差,但整体构图已经很成熟了,处理抠图以及融合都比较干净。

而且上面这个例子还顺道考查了其文字渲染能力,除了中文,我们再尝试一下其他文字。

最常见的英文渲染正确,并且还自带艺术字设计。

继续换成希腊文(中译为“我爱你”)也有同款优秀表现,仔细对比未发现渲染错误。

OK,短暂告别这一趴,接下来我们测试其换图or扩图能力。

开启“找茬”模式后,我们不得不承认它确实只更换了吊床颜色,其他素材均和原图一致。

同时可以看到,在秒速生图过程中,它还会在接收用户指令后给出自己的理解。

此外,如果只给人物上半身,要求它生成完整人物形象呢?

第一次扩图,它只前进了一小步,完成了更多的人物上半身复原工作。

新生成的部分看起来也非常合理,从一根蓝色肩带扩展到了背带裤穿搭。

不过这不是我们一开始想要的“全身肖像”,所以继续……

最终结果如下,人物的比例和姿态都很完美,生成效果着实惊艳。

最后我们也体验了一波实时绘图功能,结论是其原生图像生成的速度确实快。

我们先随意画了一个太阳的草图,要求它为太阳加上笑脸,结果立马就搞定了。

而且还支持上色,效果也非常不错。

小结一下,从我们的实测来看,升级后的Gemini原生图像生成功能确实表现惊艳,尤其在遵循用户指令、文本渲染等方面。

当然,除了我们的测试,更多网友也第一时间分享了各自的玩法。

比较经典的就是用来搞装修设计,可以一键测试自己想要的装修风格。

不过也有浅浅翻车的,用它来扩图时最后生成的人物比例有点子怪异。

与此同时,也有人将它和近期非常火爆的GPT-4o生图进行了对比,初步结论是整体仍不如GPT-4o(doge)

One More Thing

值得一提的是,谷歌最新生图功能还能搭配Gemini 2.5 Pro(近期以强悍的代码能力而出圈)食用。

只需在提示栏中选择 “Canvas”,上传一张图片后输入下列提示词:

Transform this image into a code-based representation of its natural behavior.(将此图像转换为基于代码的自然行为表示)

最终就能得到一段视频演示。

除了预览效果,还能一键切换查看代码。

最后,也欢迎大家进行更多测试,顺便评论区带图分享一波~

在线体验:
https://aistudio.google.com/

参考链接:
[1]https://x.com/OfficialLoganK/status/1920151503349711061
[2]https://developers.googleblog.com/en/generate-images-gemini-2-0-flash-preview/
[3]https://x.com/Google/status/1920233829219840487
[4]https://x.com/Temjinck/status/1920234959346020664

—  —

📪 量子位AI主题策划正在征集中!欢迎参与专题365行AI落地方案,一千零一个AI应或与我们分享你在寻找的AI产品,或发现的AI新动向

💬 也欢迎你加入量子位每日AI交流群,一起来畅聊AI吧~



一键关注 👇 点亮星标

科技前沿进展每日见


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

谷歌 Gemini 图像生成 AI 免费试用
相关文章