Android 开发者 11小时前
Gemini API 集成 Imagen 3,带来更强大的图像生成功能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google 宣布开发者现在可以通过 Gemini API 访问 Imagen 3,这是一个先进的图像生成模型。Imagen 3 擅长生成高质量、风格多样的图像,支持超现实主义、印象派等多种风格。该服务初期面向付费用户,未来将开放给免费用户。用户可以通过 Gemini API 控制图像的宽高比等参数,每张图像的生成价格为 0.03 美元。为防止错误信息传播,所有 Imagen 3 生成的图像都包含 SynthID 水印。开发者可以参考提供的 Python 代码示例,轻松开始使用 Imagen 3。

🖼️ Google 通过 Gemini API 开放 Imagen 3,允许开发者生成高质量、风格多样的图像,涵盖超现实主义、印象派、动漫等多种风格。

💰 Imagen 3 初期仅对付费用户开放,未来将面向免费用户。生成图像的价格为每张 0.03 美元,用户可控制宽高比、生成选项等参数。

🛡️ 为防止错误信息和误用,Imagen 3 生成的图像都包含 SynthID 水印,用于识别 AI 生成图像。

💡 提供了 Python 代码示例,展示了如何使用 Gemini API 和 Imagen 3 生成图像,方便开发者快速上手。

📚 开发者可以在 Gemini API 开发者文档中探索更多提示技巧和图像风格,以及技术报告附录 D 了解评分、方法论及性能提升的更多详情。

原创 Google 2025-05-09 17:33 北京

开发者现在可以通过 Gemini API 访问 Imagen 3,更加轻松高效地生成具有视觉吸引力、无伪影且风格多样的图像。

作者 / 产品经理 Ivan Solovyev


开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户推出。


🔗 Gemini API

https://ai.google.dev/gemini-api/docs/imagen

🔗 Imagen 3

https://ai.google.dev/gemini-api/docs/imagen

🔗 付费用户

https://ai.google.dev/gemini-api/docs/billing


Imagen 3 擅长生成具有视觉吸引力、无伪影且风格多样的图像,从超现实主义图像到印象派风景,从抽象构图到动漫角色等应有尽有。改进后的提示遵循能力使其能够轻松地将绝佳创意转化为高质量图像。总体而言,Imagen 3 在各种基准测试中展现出了最先进的性能。通过 Gemini API 使用 Imagen 3 的价格为每张图像 0.03 美元,并且用户可以控制宽高比、生成选项数量等更多参数


🔗 基准测试

https://deepmind.google/technologies/imagen-3/#benchmarks

🔗 更多参数

https://ai.google.dev/gemini-api/docs/imagen


为了帮助遏制错误信息和错误归因,所有由 Imagen 3 生成的图像都包含一个不可见的数字 SynthID 水印,用于识别它们为 AI 生成的图像。


🔗 SynthID

https://deepmind.google/technologies/synthid/



了解 Imagen 3 的实际效果


下方图库展示了 Imagen 3 在多种风格图像上的卓越表现。

△ 提示:一群看起来很开心的人,自然光,8k

△ 提示:人物装扮为 20 世纪 20 年代时髦女郎风格,超现实主义肖像,复古风格,黑白照片,优雅的姿势,8k

△ 提示:设想一块复古手表的特写。生成描绘手表精细机械结构的写实图像

△ 提示:印象派风景画,描绘向日葵花田上的日落景象,色彩鲜艳,笔触厚重,灵感来自莫奈

△ 提示:超现实的梦境,巨大的乌龟背上长着郁郁葱葱的森林,漂浮在星空中,闪闪发光的蘑菇,自然发光的植物,空灵的氛围

△ 提示:新鲜烘焙的咖啡豆从粗麻布袋中洒落在原木质地的桌上,旁边的咖啡杯中热气升腾,杯子上用草书写着 "Awaken Your Senses",温暖迷人的氛围,晨光,产品摄影

△ 提示:超现实主义肖像,一位有着锐利蓝眼睛、正在大笑、有雀斑的女性,戏剧性光影,肌肤纹理细腻,8k

△ 提示:黎明时分壮丽的山脉全景

△ 提示:显示游戏中的场景,玩家需要在凌乱的桌子抽屉中寻找到特定的物品

△ 提示:以梵高风格绘制的城市景观,笔触旋转,色彩鲜艳



开始使用 Gemini API 中的 Imagen 3


此 Python 代码段展示了如何使用 Gemini API 和 Imagen 3 生成图像。

from google import genai

from google.genai import types

from PIL import Image

from io import BytesIO


client = genai.Client(api_key='GEMINI_API_KEY')


response = client.models.generate_images(

    model='imagen-3.0-generate-002',

    prompt='a portrait of a sheepadoodle wearing cape',

    config=types.GenerateImagesConfig(

        number_of_images=1,

    )

)

for generated_image in response.generated_images:

  image = Image.open(BytesIO(generated_image.image.image_bytes))

  image.show()


图像已生成


您可以在 Gemini API 开发者文档中探索更多关于提示技巧和图像风格的内容,有关评分、方法论及性能提升的更多详情,请参阅我们更新后的技术报告附录 D。


🔗 Gemini API 开发者文档

https://ai.google.dev/gemini-api/docs/imagen-prompt-guide

🔗 技术报告

https://storage.googleapis.com/deepmind-media/imagen/imagen_3_tech_report_update_dec2024_v3.pdf#page=26


我们非常高兴能够迈出第一步,将我们的生成式媒体模型扩展至 Gemini API。我们还计划在不久的将来推出更多模型,以便开发者能够将生成式媒体与语言模型结合起来使用。欢迎您持续关注 "Android 开发者" 微信公众号,及时了解更多开发技术和产品更新等资讯动态!





阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Google Imagen 3 Gemini API 图像生成 AI
相关文章