IT之家 6 月 29 日消息,除了推出 DLSS 4 正式版,英伟达还在其最新的 DLSS SDK 版本中对显存(VRAM)使用进行了优化。VideoCardz 发现,DLSS 310.3.0 将 Transformer 模型的显存使用量降低了 20%。
此次更新后,DLSS 的显存占用情况更接近传统的 CNN 模型。此前,DLSS 的 Transformer 模型显存占用几乎是其替代的 CNN 模型的两倍。然而,经过英伟达的优化,现在的 Transformer 模型仅比 CNN 模型多占用 40% 的显存。具体而言,在 1080p 分辨率下,旧版 Transformer 模型占用 106.9MB 显存,而新版仅占用 85.77MB,相比之下,CNN 模型则占用 60.83MB 显存。DLSS 的显存占用会随着分辨率的提高而线性增加,例如在 4K 分辨率下,Transformer 模型的显存占用会增加 3.5 倍,达到 307.37MB。
据IT之家了解,显存占用的优化在实际应用中可能不太容易被察觉,例如,在 4K 分辨率下,DLSS 显存占用的减少仅为 80MB,而在 1440p 和 1080p 分辨率下,减少的显存容量则更少。对于现代显卡的显存容量来说,80MB 或更少的减少几乎可以忽略不计。不过,在 8K 分辨率下,DLSS Transformer 模型的显存占用仍然较高,即使经过优化后,其显存占用仍超过 1GB。
尽管如此,Transformer 模型显存占用减少 20% 仍然令人印象深刻,尤其是考虑到该模型的强大功能。DLSS 4 的 Transformer 模型参数数量是其 CNN 前身的两倍,能够实现接近原生图像质量的超分辨率效果。英伟达此前也曾对 DLSS 3.8.10 进行过类似的优化,未来 DLSS 4 的 DLL 文件有望进一步精简。
值得注意的是,此次显存优化仅针对 Transformer 超分辨率模型,而不涉及帧生成部分。DLSS 4 在帧生成方面也取得了显著进步,显存占用减少了 30%。帧生成部分的显存占用远高于 DLSS 的超分辨率部分。例如,英伟达在其一篇博客文章中提到,《战锤 40K:暗潮》在 4K 分辨率下使用 DLSS 4 帧生成功能时,显存占用比 DLSS 3 减少了 400MB。