2025-01-20 18:30 湖北
Sana可以直接生成4K画质的图片,生图速度非常快,质量很高!一起来看看吧!
随着春节的脚步越来越近,本周已经是年前的最后一周了。相信很多设计师的心已经飞回了家,盼望着与家人团聚。
在这年终岁末之际,我要给大家介绍一款非常适合设计师的AI图像处理工具,不管是面对甲方的各种紧急需求,还是用来处理日常所需的设计素材,这款AI工具绝对能让你事半功倍!
这个工具就是英伟达近期推出的SANA开源图像生成模型。SANA不仅能够高效生成分辨率高达4096×4096的图像,还具备极快的生成速度。
需要的小伙伴评论区扣 “ 666 ”,明天上午11点统一给大家回复!!
SANA的性能表现
SANA的特点就是一个快字,SANA-0.6B只用不到一秒就可以生成1024×1024分辨率图像,比Flux-Dev快25倍,而生成4096×4096分辨率图像的速度比Flux-Dev快106倍。
Nvidia的团队在Sana的研究论文写道:“Sana-0.6B与现代巨型扩散模型(如通量-12B)相比非常有竞争力,其测量吞吐量小20倍,快100倍以上。Sana-0.6B可以部署在16GB笔记本电脑GPU上,生成1024×1024分辨率的图像只需不到1秒的时间。”
低成本部署与开源
SANA的另一个亮点是其低成本的部署能力。SANA-0.6B可以在16GB的笔记本电脑GPU上运行,生成1024×1024分辨率的图像仅需不到1秒,并且22GB显存能直出4096×4096分辨率图像。
这一特性使得SANA不仅适用于高端计算设备,也能在普通用户的笔记本电脑上高效运行。此外,英伟达还宣布将公开发布SANA的代码和模型,进一步推动了文本到图像生成技术的普及和应用。
为了帮助大家更快上手,我们团队的小瓜也制作了详细的介绍视频,可以帮助大家在使用超高分辨率图像生成的时候变得更加高效。
SANA核心特点
目前SANA已经官方支持ComfyUI,用户可以通过ComfyUI的工作流轻松使用SANA模型。同时,官方还提供了LoRA训练工具,支持用户进行个性化模型训练。以下是核心功能介绍:
1️⃣ 超高效率: Sana-0.6B模型生成1024×1024分辨率的图像仅需不到1秒
2️⃣ 轻量部署: 可在16GB显存的笔记本GPU上运行
3️⃣ 高分辨率: 支持生成高达4K (4096×4096) 分辨率的图像
4️⃣ 开源支持: 已官方支持ComfyUI,并提供LoRA训练工具
SANA的高效性能主要得益于以下几个技术创新:
1️⃣ 深度压缩自编码器: 实现了32倍的图像压缩比,大幅减少了潜在标记的数量
2️⃣ 线性DiT: 采用线性注意力机制替代传统注意力,将复杂度从O(N²)降低到O(N)
3️⃣ 解码器型文本编码器: 使用Gemma作为文本编码器,提升了文本理解能力
4️⃣ 高效训练和推理策略: 创新的Flow-DPM-Solver减少了推理步骤,提升了生成速度
今天就和大家聊到这里,需要 SANA 的小伙伴评论区扣 “ 666 ”,明天上午11点统一给大家回复!!欢迎关注点赞支持一波或转发朋友圈,如果不想错过每一次更新,可以将我设为星标哦~⭐~