原创 SiliconCloud 2024-10-23 08:14 北京
生图速度极快,为生成式AI应用带来高效用户体验。
今天,Stability.ai发布了文生图模型Stable Diffusion 3.5系列,包括Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo,此外,Stable Diffusion 3.5 Medium将在10月29日发布。
其中,Stable Diffusion 3.5 Large是一个8B参数规模的模型,是SD系列中最强大的基础模型。它具有出色的质量与提示遵循能力,适用于1百万像素分辨率的专业使用场景。
一如即往,硅基流动SiliconCloud第一时间上线了Stable Diffusion 3.5 Large。后续,我们也会很快在SiliconCloud上线Stable Diffusion 3.5 Large Turbo,该模型能在4步数内生成高质量图像,且具有出色的提示遵循能力。
感受一下Stable Diffusion 3.5 Large在SiliconCloud上推理加速后的效果。
Playground传送门
https://cloud.siliconflow.cn/playground/text-to-image/17885302600
API文档
https://docs.siliconflow.cn/api-reference/images/images-generations
与其他各类开源大模型一样,开发者在本地运行Stable Diffusion 3.5 Large模型有一定部署门槛与成本。现在,SiliconCloud上线该模型后,免去了开发者的部署门槛,并在开发应用时轻松调用相应的API服务。
更重要的是,SiliconCloud平台上的Stable Diffusion 3.5 Large输出速度极快,能为你的生成式AI应用带来更高效的用户体验。目前,用户可在平台上免费使用该模型。
平台还支持开发者自由对比体验各类大模型,最终为自己的生成式AI应用选择最佳实践。
SD 3.5 Large的图片生成效果
提示词:一片广阔无垠的沙漠中,一位女性战士站在图片中心。她的身影与无尽的沙丘形成鲜明对比,身着未来感十足的后末日铠甲,装饰有科幻元素。她转头面向镜头,目光深邃而神秘,仿佛隐藏着某种秘密,这幅艺术作品的风格受到电影《沙丘》的启发,营造出一种荒凉与未来美学的感觉,沙漠的天空被涂上了柔和的色调,远处的沙丘在金色的光芒中闪烁,整幅作品的基调沉稳而有力
提示词:一只穿着运动服的短毛小猫站在机场里,好奇地仰望着出发显示屏,小猫背着一个迷你背包,戴着一顶旅行帽,旁边放着一个叫“SiliconCloud”的小行李箱,小猫是拟人化的,以电影风格和逼真的照片效果呈现
提示词:现代抽象数字艺术作品,采用左右分隔的布局,左侧为黑色,右侧为米色。主题是一幅位于右侧的女性脸庞的单色肖像,脸庞光滑,眼睛紧闭,左侧包含几何形状,如红色半圆、白色和红色垂直线条,以及一个与肖像相交的红色圆圈,设计中融入了棕榈树和抽象线条,增添了超现实的元素,整体构图简约,注重对比和对称
提示词:桃子和水的摄影照片,浅粉色背景,超现实静物摄影,半透明质感,水滴,镜面反射,绚丽的色彩
提示词:一张草地照片,草地上有一座可爱的小房子,屋顶是粉色的,远处有两只羊,背景是蓝天和白云,光线柔和
模型评测表现及亮点
据Stability.ai官方介绍,Stable Diffusion 3.5 版本在以下方面表现出色,使其成为市场上最可定制和易用的图像模型之一,同时它在提示遵循和图像质量方面表现出顶级效果:
自定义:轻松微调模型以满足你的特定创意需求,或基于自定义的工作流构建应用程序。
高效性能:可在标准消费级硬件上运行,尤其是Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo模型。
多样性输出:生成代表世界的图像,不局限于某一类型人物,包括不同肤色和特征,无需大量提示。
多变风格:能够生成包括3D、摄影、绘画以及几乎任何可想象的视觉风格在内的广泛风格和美学。
Stability.ai官方还指出,Stable Diffusion 3.5 Large在遵循提示方面领先同类模型,并在图像质量上与更大规模的模型相媲美。
Stable Diffusion 3.5 Large Turbo在其同规模模型中具有最快的推理时间,同时在图像质量和提示遵循方面具有高度竞争力,即使与同规模的非蒸馏模型相比也是如此。
Stable Diffusion 3.5 Medium优于其他中等规模大小的模型,平衡了提示遵循和图像质量,使其成为高效、高质量性能模型的首选。
Token工厂SiliconCloud
Qwen2.5(7B)、Llama3.1(8B)等免费用
作为集合顶尖大模型的一站式云服务平台,SiliconCloud致力于为开发者提供更快、更便宜、更全面、体验更丝滑的模型API。
除了Stable Diffusion 3.5 Large,SiliconCloud已上架包括Llama-3.1-Nemotron-70B-Instruct、Qwen2-VL、InternVL2、Qwen2.5-Coder、Qwen2.5-Math-72B、Qwen2.5-7B/14B/32B/72B、FLUX.1、DeepSeek-V2.5、InternLM2.5-20B-Chat、BCE、BGE、SenseVoice-Small、Llama-3.1、GLM-4-9B-Chat在内的多种开源大语言模型、图片生成模型、代码生成模型、向量与重排序模型以及多模态大模型。
其中,Qwen2.5(7B)、Llama3.1(8B)等多个大模型API免费使用,让开发者与产品经理无需担心研发阶段和大规模推广所带来的算力成本,实现“Token 自由”。
近期更新
• 模型判官来了!一键快测多个大模型效果
• SiliconCloud上线Qwen2-VL、InternVL2
• SiliconCloud API更新:FLUX.1收费版不限流
•10倍工程师编码工具:Cursor x SiliconCloud
•SiliconCloud上线Llama-3.1-Nemotron-70B
• 分享ComfyUI BizyAir工作流,赢东京往返机票