cnBeta全文版 前天 08:20
一觉醒来,国产显卡开始追着老黄的4060打了?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近日,国内厂商砺算科技发布了其首款自主研发的6nm工艺显卡,型号为7G106(消费级)和7G105(专业级)。根据发布会信息,7G106的栅格性能已赶超英伟达RTX 4060,并能在1080P分辨率下流畅运行《黑神话:悟空》。该显卡基于台积电N6工艺,采用砺算自研TrueGPU架构,实现了从计算核心到指令集的完全自主设计。其在三角形渲染效率、显存使用效率等方面进行了优化,并支持FP32或INT32指令双发射。在实测中,7G106在Geekbench OpenCL测试中表现优于RTX 4060,3DMark Fire Strike分数也接近4060。尽管在驱动适配和游戏优化方面仍有提升空间,但其硬件性能的突破为国产显卡产业注入了新的活力,未来发展值得期待。

🌟 **自主研发TrueGPU架构,性能媲美主流**: 砺算科技的7G106显卡采用完全自主设计的TrueGPU图形架构,基于台积电N6工艺。通过重构图形管线执行逻辑,实现智能乱序渲染,提升了50%的渲染效率,并在显存使用效率上进行了优化,这些技术特点使其在光栅性能上能与英伟达RTX 4060相媲美,甚至在某些测试中表现更佳。

🚀 **游戏实测表现亮眼,1080P流畅运行**: 在游戏实测方面,7G106在1080P高画质下,《黑神话:悟空》平均帧数超过70帧,且没有明显掉帧情况,表现与关闭DLSS的RTX 4060相当。在另一款游戏《明末:渊虚之羽》中,同样在高画质下也能达到70帧以上,这表明其核心规模、大显存和高位宽提供了显著的性能优势,为国产显卡在游戏体验上迈出了重要一步。

💡 **技术细节前瞻,为未来发展奠定基础**: 7G106显卡支持FP32或INT32指令双发射,以及矩阵数据块存储等特性,这些先进的设计思路与英伟达和AMD的最新显卡技术看齐,展现了国产显卡在技术前沿的追赶能力。虽然在DX12 Ultimate和VRS等API支持上仍有进步空间,但其硬件层面的创新为未来驱动优化和性能提升奠定了坚实的基础。

🧐 **成本与价格的未来博弈,用户期待高性价比**: 砺算科技在有限的募资规模下实现了4060级别的显卡,这让人们对其成本控制和未来定价充满期待。如果能提供具有竞争力的价格,将极大地吸引消费者,并有望改变国内显卡市场的格局。用户普遍希望国产显卡能带来高性价比的产品,并愿意陪伴其一同成长,共同推动产业发展。

照理说,新产品发布一类的文章托尼都是在工作日给大家写的,因为厂商们通常选择在工作日开发布会。但是这家名叫 “砺算科技” 的厂商很神奇,他们周末加了个班( 被迫着我也加了个班 ),但是发布的东西却堪称非常重磅了 ——首款国产自研 6nm 工艺显卡!


没错,是能插在电脑上打游戏的那种显卡,而且按照砺算在发布会上的说法,这款显卡的光栅性能赶超了英伟达的 RTX 4060,甚至还能稳玩 1080P 的黑猴?看完昨天咱们国内企业 “砺算科技” 的新品发布会,说实话托尼到现在人还是懵的。

因为根据相关报道,砺算科技截至 2024 年仅仅募资 6.28 亿,但是作为对比,我们每天都在骂贵的英伟达、骂不争气的英特尔和 AMD,他们哥仨的研发投入动辄就是几百亿。国内芯片创业公司用着十几分之一的资源“手搓”出了 4060 级别的显卡???

假如事情是真的,那这真的妥妥是一个 “显卡圈子” 的 DeepSeek 故事了。

不过着急看这两款产品详细测试的小伙伴估计要再等一等了,昨天发布的消费级显卡 7G106,及专业级显卡 7G105,不出意外应该是 8 月份产品送样,9 月份才开始量产。


所以真正的上手实测大家还得再等等,但是如果你还好奇昨天的发布会还公布了哪些细节,托尼这里可以带着大家再盘一下这两款国产自研显卡昨天公开的信息。

首先是这两款显卡核心的 GPU 部分,基于台积电 N6 工艺,并且采用了 “ 砺算科技 ” 自研的 TrueGPU 图形架构。这也意味着从计算核心到指令集完全由自主设计,而不是市场上常见的 “ 公版 IP 授权 + 自主优化 ” 的形式。


这样做有啥好处呢?举几个发布会录播提到的例子吧 ——

我们都知道,GPU 的 3D 渲染,也就是我们看到的图形,是根据无数的三角形像积木一样拼凑出来的。GPU 的渲染过程,就是三角形的拆分、拼凑和后续计算的过程。

根据砺算科技官方的说法,砺算 7G106 的三角形渲染,重构了图形管线的执行逻辑,智能乱序渲染,而且能根据负载情况动态分配计算单元。不用像传统的 GPU 图形一样,按照既定的步骤,低效地一步步执行,所以砺算 7G106 能够在适配场景下直接提升 50% 的渲染效率。


此外,砺算 7G106 还支持 FP32 或 INT32 的指令双发射,以方块形式存储矩阵数据等特性,可以优化 40% 的显存使用效率。

从这些支持特性上来看,砺算显卡的设计思路还是比较先进的 ——

就拿 FP32/INT32 双发射这点来说,我查了一下,NVIDIA 也是从 20 系显卡才开始支持,AMD 则是从前两年的 RX7000 系显卡才开始支持,英特尔则是从 A700 系列的独显才开始支持。

说完 GPU,接下来再来看下两款显卡的硬件规格:


根据发布会录播,消费级显卡砺算 7G106 搭载 12GB GDDR6 显存,但是功耗频率这样的基础硬件信息并未公布;参考同行爆料的信息,砺算 7G106 位宽 192bit拥有 192 个纹理单元(TMU)和 96 个光栅单元(ROP)。


假设这个爆料属实,那么砺算 7G106 就是拥有 4060 两倍规模的纹理单元和光栅单元,那么它在跑分上超过 4060,好像就说得过去了。除此之外,砺算 7G106 支持 DirectX 12、Vulkan 1.3、OpenGL 4.6 和 OpenCL 3.0 等主流 API,大概是个够用但并不算进阶的水平。

因为目前 DX 12 API 最新的版本是 DX12 Ultimate,Vulkan 最新版本是 1.4。缺乏这两个 API 最新版本的支持,就意味着砺算 7G106 有可能不支持光追和可变速率着色(VRS),影响游戏时画面效果和帧率,并且在渲染能力上存在一定的劣势。

可变速率着色(VRS)示意,从左到右着色率变低


反观砺算想要挑战的行业霸主英伟达这边,先是在 2014 年发布的 GTX 900 系列显卡上支持了瓦片式渲染和改进的调度器,这两样技术其实也属于砺算这次宣传的 “ 智能乱序渲染 ” 的类似物。

但是英伟达直到 4 年后的 RTX20 系列才支持可变速率着色(VRS),然后才支持了完整的 DX12 Ultimate API,砺算 7G106 的后续产品,明显还有一些需要提升的地方。

其他方面,砺算 7G106 采用 PCIe 4.0 x16 标准,提供 4 个 DisplayPort 1.4 接口,公版卡没有 HDMI 接口。


顺带说一下专业卡 7G105 的规格,整体来看处于中高端的水平 ——

配备 24GB GDDR6 ECC 显存、最大纹理填充率 384GT / s,最大像素填充率 192GP / s,支持 FP32 和 INT8 计算,FP32 最大吞吐量为 24 TFLOPS,也适合高像素渲染以及大模型训练。

前面架构和规格的部分,目前能公开找到的资料其实不多,但我相信参数啥的大家也就随便看看,游戏党们更关心的还是具体的实测 ——

之前也提到了,砺算 7G106 的部分光栅性能是强于 RTX 4060 的……

比如在 Geekbench 测试里,衡量 GPU 通用计算能力的 OpenCL 跑分,砺算 7G106 得分为 111290 分,比 RTX 4060 的 101028 分,整整高出 10%,甚至直逼 RTX 5060!如果上市的时候再搭配不错的价格,感觉花更少的钱就能买到光栅性能这块,就不止是 AMD 一家的优势了。


更贴近游戏性能的 3DMark Fire Strike( 1080p )测试,砺算 7G106 的跑分成绩为 26800 分,作为对比 4060 大约是2w7 到 2w8 的成绩,也几乎快追上 4060 了。


在更考验显卡性能的 4K 分辨率测试项目 Steel Nomad 里,砺算 7G106 的跑分也能有 2256 分,参考公开的测试数据,RTX 4060 这项测试的数据在 2302 左右。


总结下来,砺算 7G106 显卡的整体表现,虽然说不至于完全对标英伟达 RTX 4060,但光栅化性能是妥妥的赶上了,然后在一些小项目上体现出了自己的优势。

但是我们都知道,老黄除了硬件还有软件,就拿游戏来说,DLSS 是老黄的招牌。

根据发布会录播的来看,砺算也做了个名叫 NRSS 的 DLSS 类似物,但是没有实机演示;我在录播里看到,最后发布会现场是拿黑神话内置的游戏科学 NXSR 做了个超分的演示,也就是通过原生低画质 + 超采样实现 4K 分辨率运行黑神话悟空,但是对一款甜品卡来说,咱们直接看 1080P 的表现就好了。

《黑神话:悟空》在 1080P 分辨率、高画质设置下,砺算 7G106平均帧数能过 70 帧,而且在打斗过程中,遇到野怪、释放技能和特效,也没有明显的掉帧情况。这个表现,其实跟 4060 关掉 DLSS “裸玩” 黑猴的帧数也差不多了(虽然没这个必要)……


更让托尼感觉到意外的是,明末:渊虚之羽在1080P 分辨率、高画质设置下,依旧能跑到 70 帧以上。参考同行针对这个游戏做的实测,RTX 5060显卡在 DLSS4 多帧生成的条件下,可以达到 149 帧,但会感觉到明显卡顿。


考虑到这是个上线还没有两天的游戏,这么短的时间,砺算 7G106 肯定来不及针对游戏做适配,就能达到这种可玩的水平,那只能理解为砺算 7G106 核心规模更大,以及大显存、高位宽,带来的力大砖飞的提升了。


至于老牌的 3A 游戏古墓丽影:暗影,砺算 7G106 在游戏时只有平均 80 帧以上,表现就要差一些了。在同样的画质设置下,4060 对这款游戏有适配优化,可以跑到 147 帧。这其实也是摆在国产 GPU 面前的最大的问题,硬件追赶只是第一步,后续的驱动适配和游戏优化,路还长着呢……

如果托尼后续能够拿到这款显卡,到时候也会给大家来个全面测试。

感觉砺算 7G106 未来随着驱动的优化,整体达到 4060 的水平应该没有什么问题,而且游戏玩家们其实很包容国产显卡的,哪怕最后的实际表现不如 4060,或者说用着真有 bug,只要价格别割韭菜,愿意和国内玩家们交朋友,那我相信,大家都是陪着你一起成长的。

我们不妨对比另外一个国产显卡摩尔线程 S80——


一开始大家也吐槽摩尔线程的 S80 显卡很多游戏都玩不了,缺乏优化,但是后来它就降价了,有一阵的优惠价格甚至掉到了 1000 块钱左右,之后各路评论区对摩尔线程的评价一下子就反转了,变成了 “只有中国人真心对中国人好”……

所以问题来了,大家觉得这次砺算的显卡会卖多少钱呢?

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

砺算科技 国产显卡 GPU TrueGPU RTX 4060 AI 科技创新
相关文章