SANA不到1秒超快生图！本地部署直出4K图像

2025-01-20 18:30 湖北

Sana可以直接生成4K画质的图片，生图速度非常快，质量很高！一起来看看吧！

随着春节的脚步越来越近，本周已经是年前的最后一周了。相信很多设计师的心已经飞回了家，盼望着与家人团聚。

在这年终岁末之际，我要给大家介绍一款非常适合设计师的AI图像处理工具，不管是面对甲方的各种紧急需求，还是用来处理日常所需的设计素材，这款AI工具绝对能让你事半功倍！

这个工具就是英伟达近期推出的SANA开源图像生成模型。SANA不仅能够高效生成分辨率高达4096×4096的图像，还具备极快的生成速度。

需要的小伙伴评论区扣 “ 666 ”，明天上午11点统一给大家回复！！

SANA的性能表现

SANA的特点就是一个快字，SANA-0.6B只用不到一秒就可以生成1024×1024分辨率图像，比Flux-Dev快25倍，而生成4096×4096分辨率图像的速度比Flux-Dev快106倍。

Nvidia的团队在Sana的研究论文写道：“Sana-0.6B与现代巨型扩散模型（如通量-12B）相比非常有竞争力，其测量吞吐量小20倍，快100倍以上。Sana-0.6B可以部署在16GB笔记本电脑GPU上，生成1024×1024分辨率的图像只需不到1秒的时间。”

SANA的另一个亮点是其低成本的部署能力。SANA-0.6B可以在16GB的笔记本电脑GPU上运行，生成1024×1024分辨率的图像仅需不到1秒，并且22GB显存能直出4096×4096分辨率图像。

这一特性使得SANA不仅适用于高端计算设备，也能在普通用户的笔记本电脑上高效运行。此外，英伟达还宣布将公开发布SANA的代码和模型，进一步推动了文本到图像生成技术的普及和应用。

为了帮助大家更快上手，我们团队的小瓜也制作了详细的介绍视频，可以帮助大家在使用超高分辨率图像生成的时候变得更加高效。

SANA核心特点

目前SANA已经官方支持ComfyUI，用户可以通过ComfyUI的工作流轻松使用SANA模型。同时，官方还提供了LoRA训练工具，支持用户进行个性化模型训练。以下是核心功能介绍：

1️⃣ 超高效率: Sana-0.6B模型生成1024×1024分辨率的图像仅需不到1秒

2️⃣ 轻量部署: 可在16GB显存的笔记本GPU上运行

3️⃣ 高分辨率: 支持生成高达4K (4096×4096) 分辨率的图像

4️⃣ 开源支持: 已官方支持ComfyUI，并提供LoRA训练工具

SANA的高效性能主要得益于以下几个技术创新：

1️⃣ 深度压缩自编码器: 实现了32倍的图像压缩比，大幅减少了潜在标记的数量

2️⃣ 线性DiT: 采用线性注意力机制替代传统注意力，将复杂度从O(N²)降低到O(N)

3️⃣ 解码器型文本编码器: 使用Gemma作为文本编码器，提升了文本理解能力

4️⃣ 高效训练和推理策略: 创新的Flow-DPM-Solver减少了推理步骤，提升了生成速度

今天就和大家聊到这里，需要 SANA 的小伙伴评论区扣 “ 666 ”，明天上午11点统一给大家回复！！欢迎关注点赞支持一波或转发朋友圈，如果不想错过每一次更新，可以将我设为星标哦~⭐~