快科技资讯 2024年08月05日
英伟达摊上大事儿了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

英伟达最新AI GPU Blackwell架构芯片延期至2025年Q1发布,原因是设计缺陷导致良率和产能受影响。这一延期将影响微软、Meta、xAI等大客户的数据中心建设,并可能导致英伟达失去客户信任。Blackwell架构芯片拥有更高的性能和更低的功耗,并使用“第二代Transformer引擎”和“第五代NVLink网络技术”,被认为是AI领域的关键技术。然而,设计缺陷带来的延期将对英伟达的市场份额和未来发展产生重大影响。

🤔 英伟达Blackwell架构芯片的延期,将对英伟达的市场份额和未来发展产生重大影响。Blackwell芯片被认为是英伟达下一代AI GPU的杀手锏,其高性能和低功耗使其成为硅谷巨头们的“白月光”。然而,设计缺陷导致芯片良率和产能受影响,使得原定的量产计划被迫终止,并不得不重新设计芯片架构。

😥 这一延期将直接影响到微软、Meta、xAI等大客户的数据中心建设。这些公司已经订购了价值数百亿美元的Blackwell芯片,并计划将其用于AI模型的训练和部署。延期发布将导致这些公司的数据中心建设进度延误,并可能影响其在AI领域的竞争力。

🤨 除了数据中心建设受影响外,英伟达也可能失去客户的信任。对于那些已经将业务发展规划与Blackwell芯片挂钩的公司来说,延期发布无疑是一个巨大的打击。此外,英伟达还可能面临客户的诉讼,因为延期发布可能导致客户的损失。

💪 Blackwell架构芯片的性能和功耗都非常出色,其“第二代Transformer引擎”和“第五代NVLink网络技术”使其在AI领域具有竞争优势。然而,设计缺陷带来的延期将影响其市场推广和应用,并可能导致英伟达在AI领域的领先地位受到挑战。

💰 延期发布也可能影响英伟达的财务状况。Blackwell芯片被寄予厚望,预计将推动英伟达数据中心业务的收入大幅增长。然而,延期发布将导致芯片的供应量减少,并可能影响英伟达的营收和利润。

❓ 尽管英伟达表示Blackwell芯片的产量将在下半年逐步提升,但市场对该芯片的预期已经发生了变化。延期发布可能导致客户对Blackwell芯片的信心下降,并可能影响其未来市场占有率。

💡 这次Blackwell芯片的延期发布,也为其他AI芯片厂商提供了机会。英伟达的延期发布将给其他厂商更多的时间来追赶,并可能导致AI芯片市场的竞争更加激烈。

😔 对于英伟达来说,Blackwell芯片的延期发布是一个巨大的挑战。如何解决芯片设计缺陷,并尽快恢复量产,将是英伟达面临的难题。如果不能及时解决问题,英伟达可能会失去市场份额,并可能影响其在AI领域的领先地位。

🚀 然而,Blackwell芯片的延期发布也可能是一个机遇。英伟达可以通过这次事件来改进芯片设计,并提升芯片的性能和可靠性。如果英伟达能够成功克服挑战,并推出性能更加强大的Blackwell芯片,那么它仍然能够保持其在AI领域的领先地位。

🤔 总而言之,英伟达Blackwell芯片的延期发布是一个复杂的事件,它将对英伟达、客户和整个AI行业产生重大影响。如何应对这一挑战,将考验英伟达的智慧和能力。

🧐 这次事件也为我们提供了一些启示。在科技领域,技术创新是至关重要的,但同时也需要谨慎和周密的规划。英伟达的经验教训告诉我们,任何产品在发布之前都需要经过严格的测试和验证,以确保其性能和可靠性。

👍 此外,我们也要认识到,技术发展是一个不断迭代的过程,任何产品都可能存在缺陷。对于任何科技公司来说,及时发现问题并解决问题,是保持竞争力的关键。

💪 英伟达的Blackwell芯片延期发布,为我们提供了一个思考的机会。如何在技术创新和产品质量之间取得平衡,如何应对市场竞争和技术风险,这些都是需要我们认真思考的问题。

🚀 相信英伟达会从这次事件中吸取教训,并继续在AI领域保持领先地位。

💡 同时,我们也期待其他AI芯片厂商能够抓住机会,在AI芯片市场取得更大的突破。

💪 AI技术正在不断发展,未来将会有更多新技术和新产品出现。我们相信,AI技术将为我们带来更加美好的未来。

🎉 让我们拭目以待!

😎 英伟达的黑月光,或许要黯淡一阵子了。

英伟达摊上大事儿了。

据《The Information》报道,英伟达的最新杀手锏——采用Blackwell架构的AI GPU从原定的今年Q3推迟到2025年Q1推出。据称,这款 GPU 存在设计缺陷,因此需要推迟发布产品以解决问题。

这一推迟直接鸽了微软、Meta 和 xAI 等大客户,这些公司总共订购了价值数百亿美元的芯片,关键数据中心的建设可能会因此受到影响。

有从业者表示,这可能会导致英伟达失去客户的信任,并存在被诉讼的可能。

尽管英伟达发言人很快做出了回复,并表示:“Hopper 的需求非常强劲,Blackwell 的产量将在下半年逐步提升。”

但种种迹象显示,被硅谷巨头们寄予厚望的Blackwell,可能真的要“跳票”了。

硅谷巨头的“白月光”

当采用Blackwell架构的B100/B200芯片在GTC大会亮相后,知名华尔街投行Keybanc Capital Markets发出了一份预测:

“Blackwell芯片将推动英伟达数据中心业务的收入,从2024财年(截至2024年1月)的475亿美元增长到2025年的2000多亿美元。”

众所周知,在大模型的训练与部署中,英伟达的高性能算卡居功至伟,但BlackWell真的能凭一己之力带动业绩翻倍上涨吗?

答案是完全有可能,甚至未来五年内,硅谷巨头之间的军备竞赛,在硬件层面将完全基于Blackwell架构芯片展开。

首先需要明确的是,Blackwell并不是一种芯片,而是一个平台,可以把它看作是过去Hooper架构的延伸,但性能却实现了全方位的碾压。

在Blackwell架构的芯片上,英伟达承袭了H200上“拼装芯片”的思路,采用统一内存架构+双芯配置,将2枚GPU Die(裸晶)拼接到一个GPU上,实现192GB HBM3e内存及8TB/s显存带宽。

相较于前代产品Hooper架构GPU,Blackwell结构GPU单芯片训练性能(FP8)是Hooper架构的2.5倍,推理性能(FP4)是Hooper架构的5倍。

Blackwell架构的能耗表现也异常优秀,在GTC大会现场,黄仁勋曾提到过一个举证:

“训练一个1.8万亿参数的模型,需要8000个Hopper GPU和15MW的电力,而2000个Blackwell GPU就能完成这项工作,耗电量仅为4MW。

除了性能与功耗外,Blackwell架构真正的杀手锏是其使用了“第二代Transformer引擎”以及“第五代NVLink网络技术”。

前者通过对每个神经元使用4位而不是8位的精度,使得计算能力、带宽和模型参数规模翻倍。后者则是大幅提升了GPU集群的通信效率,最高支持多达576个GPU间的无缝高速通信,解决了万亿参数混合专家模型通信瓶颈的问题。

在科技巨头们重金押注AI、自建数据中心的今天,Blackwell架构芯片所展示出的特性,让他们实在没有理由拒绝。

不过,就是这样一个具有划时代意义的平台,很可能存在设计缺陷。

正如上文所提到的,英伟达的设计思路是将两枚Die封装在一个GPU上,来实现性能的大幅度提升,但这也带来了隐患。根据《The Information》援引知情人士的爆料,最近几周当台积电的工程师为量产做准备工作时,发现这个架构的连接处设计存在缺陷,会导致芯片的良率和产能受到较为严重的影响。

因此,原定的量产计划被终止,英伟达需要重新对Blackwell进行版图设计,而在此之后,台积电也不得再进行一轮试生产工作。

谁会受伤?

同样受这一设计缺陷影响的,可能还有同样采用Blackwell架构的英伟达RTX50系列显卡。

根据最新曝料,原本预计在今年第四季发布的Blackwell RTX 50系列,将在明年1月7-10日举办的CES 2025大展上才会发布。与B100/B200这类用于AI的高性能GPU显卡不同,RTX系列是英伟达面向游戏玩家开发的显卡序列,如果不同如期发布,所带来的负面影响同样不容小觑。

当然,最受伤的还是硅谷的互联网巨头们。

在AI热潮下,科技巨头动辄豪掷数十亿美元购买高性能计算卡也屡见不鲜,而在Blackwell问世后,这些公司似乎为其准备了更多的”弹药“。

据最新季度财报显示,微软、Alphabet、亚马逊和Meta在2024年前六个月的资本支出大幅增加。不仅如此,为了在AI军备赛中保持领先地位,这些巨头还纷纷上调了支出指引,预示着对GPU的采购需求有增无减。

而这些热钱,大部分都流向了“卖铲人”英伟达。

作为英伟达最大客户之一,微软内部定下了到 2024 年底囤积 180万块 AI 芯片的目标,计划在明年 1 月向 OpenAI 提供采用 Blackwell 芯片的服务器。金融服务公司 DA Davidson 的分析师估计,去年微软在英伟达芯片上花费了 45 亿美元(325.6 亿元人民币),并计划在 2024 年将拥有的 GPU 数量增加两倍。

同样摩拳擦掌的还有Meta,在Blackwell于GTC大会上亮相的第二天,扎克伯格就发布声明表示,Meta计划将使用Blackwell来训练Llama模型。另据扎克伯格在今年年初的披露,Meta计划在年底前储备约60万枚高性能GPU,其中采用Hopper架构的H100芯片将占35万枚,而剩下的25万芯片,大概率会把位置留给Blackwell架构芯片。

值得一提的是,号称要自行研发AI芯片的马斯克,也对Blackwell展现出了极大的兴趣,他计划在2025年购买30万块 B200 GPU,金额高达90亿美元(652亿元人民币)。这批新GPU将升级X现有的 AI GPU 集群,该集群目前由10万块上一代H100 GPU组成。

随着下一代大模型所需算力的翻倍提升,各巨头间的算力军备竞赛又卷上了新高度,也让AI巨头对Blackwell B200的需求与日俱增,而这次英伟达出乎意料的延期,让这场看不到尽头的战争变得更加扑朔迷离。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

英伟达 Blackwell AI芯片 数据中心 AI军备竞赛 科技巨头
相关文章