富途牛牛头条 2024年08月03日
曝英偉達“因設計缺陷,新AI芯片推遲發佈”,大摩稱“暫停生產兩週,四季度趕上進度”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

英伟达即将推出的人工智能芯片Blackwell系列因设计缺陷面临延迟发布,可能推迟三个月或更长时间,预计大规模生产时间将推迟至明年Q1。该芯片的延迟将影响Meta Platforms、谷歌和微软等客户,他们已订购了价值数百亿美元的芯片。摩根士丹利则表示,Blackwell芯片的生产可能会暂停两周,但预计在第四季度能够赶上进度。

🤔 英伟达即将推出的Blackwell系列AI芯片因设计缺陷面临延迟发布,预计将推迟三个月或更长时间,大规模生产时间将推迟至明年Q1。该芯片的延迟将影响Meta Platforms、谷歌和微软等客户,他们已订购了价值数百亿美元的芯片。 据The Information援引知情人士称,最近几周出现了Blackwell设计问题,因为台积电的工程师在准备大规模生产时发现了缺陷。该缺陷涉及一个连接两个Blackwell GPU的处理器芯片,降低了台积电能够为英伟达生产的芯片产量,甚至可能使公司停止生产。 为了解决问题,英伟达正在与其芯片制造商台积电进行新的试生产运行。台积电重新开始生产另一款接近大规模生产的高知名度产品,以解决问题。 分析认为,在大规模生产之前发现重大设计缺陷是非常不寻常的,因为前期需要进行多次生产测试运行和模拟,以确保产品的可行性和顺利的制造过程。

🤔 摩根士丹利分析师Charlie Chan则表示,此次是对于Blackwell的一些改进工作,并非延迟,原始Blackwell设计的生产已于2024年第二季度末开始生产,任何与原始设计有关的技术问题仍可以通过软件系统解决。英伟达希望通过更换一些光罩,即“重新设计”,进一步提高Blackwell的稳定性。Blackwell的重新设计已经在台积电完成,并将在2024年第四季度成为更大批量生产的版本。 Blackwell可谓是科技公司们心目中的“白月光”,承载着巨头们的厚望。如果即将推出的B100、B200 和 GB200等 AI 芯片推迟三个月或更长时间,英伟达的客户们真的会“愁上心头”。这些客户包括Microsoft、Meta和OpenAI等,他们对英伟达AI芯片抱以极大期待,计划使用英伟达开发的“超级计算机”生产出未来几代大型语言模型、Meta AI助手和其他自动化功能等。 据The Information援引知情人士称,Meta定下价值至少100亿美元的订单,而Microsoft最近几周将其订单规模增加了20%。Microsoft 计划在 2025 年第一季度之前为 OpenAI 准备好 55000-65000 个 GB200 芯片。

🤔 设计缺陷还将影响 Nvidia NVLink 服务器机架的生产和交付,因为从事服务器工作的公司必须等待新的芯片样品,然后才能最终确定服务器机架设计。 此前,天风国际分析师郭明錤就指出,GB200 NVL36的算力优势无庸置疑,但也面临许多前所未见的设计与生产挑战,能否确保如期大量出货,答案存疑。GB200 NVL36的每个机柜耗电约80kW,而根据AMAX今年四月的调查,目前全球少于5%的数据中心可以支持每机柜50kW服务器。所以,购买GB200 NVL36前,需先确保有没有足够空间安装。GB200 NVL72的单一机柜版本,每机柜耗电130kW,短期内无法量产。

来源:华尔街见闻
作者:张雅琦

大摩表示,原始Blackwell设计的生产已于2024年第二季度末开始,任何与原始设计有关的技术问题仍可以通过软件系统解决。Blackwell的重新设计已经在台积电完成,并将在2024年第四季度成为更大批量生产的版本。

英伟达新的Blackwell系列芯片中最先进的AI芯片可能面临延迟发布。

据The Information援引知情人士称,英伟达即将推出的人工智能芯片将因设计缺陷而推迟三个月或更长时间,Blackwell大量生产或延迟至明年Q1。这可能会影响 Meta Platforms、谷歌和 Microsoft 等客户,这些公司集体订购了价值数百亿美元的芯片。

摩根士丹利则在最新报告中表示,Blackwell芯片的生产可能会暂停约两周,但可以在2024年第四季度通过台积电的努力赶上。

目前英伟达方面不愿就有关延迟的声明发表评论,但表示客户正在测试Blackwell芯片的样品,并且今年晚些时候“产量有望提高”。

在大规模生产之前发现重大设计缺陷并不常见

The Information援引参与Blackwell芯片制作人士称,最近几周出现了Blackwell设计问题,因为台积电的工程师在准备大规模生产时发现了缺陷。

GB200 芯片包含两个连接的 Blackwell GPU 和一个 Grace 中央处理单元。该缺陷问题涉及一个处理器芯片(一块用于容纳芯片电路的硅片),该芯片连接了两个Blackwell GPU。这一障碍降低了台积电能够为英伟达生产的芯片产量,甚至有可能使公司停止生产。

报道称,英伟达正在与其芯片制造商台积电进行新的试生产运行。为了不让机器限制,台积电重新开始生产另一款接近大规模生产的高知名度产品,以解决问题。这种情况也很罕见。

分析认为,在大规模生产之前发现重大设计缺陷是非常不寻常的。因为前期需要进行多次生产测试运行和模拟,以确保产品的可行性和顺利的制造过程。

按照原计划,台积电将在第三季度开始大规模生产Blackwell芯片,并从第四季度开始交付给英伟达。黄仁勋曾在5月份表示,公司计划在今年晚些时候出货大量Blackwell。

而这次的设计缺陷问题,或将使Blackwell主要芯片(B200和GB200)延迟3个月或更长时间,Blackwell大量生产延迟至明年Q1。因为在收到芯片后,云提供商通常需要大约三个月的时间才能将/其大规模集群投入运行。

大摩:只是改进并非延迟,四季度能赶上进度

摩根士丹利分析师Charlie Chan则在报告中表示,此次是对于Blackwell的一些改进工作,并非延迟:

据我们了解,原始Blackwell设计的生产已于2024年第二季度末开始生产,任何与原始设计有关的技术问题仍可以通过软件系统解决。NVIDIA希望通过更换一些光罩,即“重新设计”,进一步提高Blackwell的稳定性。

Blackwell的重新设计已经在台积电完成,并将在2024年第四季度成为更大批量生产的版本。

巨头们只关心 什么时候才能收货?

Blackwell可谓是科技公司们心目中的“白月光”,承载着巨头们的厚望。

如果即将推出的B100、B200 和 GB200等 AI 芯片推迟三个月或更长时间,英伟达的客户们真的会“愁上心头”。

这些客户包括Microsoft、Meta和OpenAI等,他们对英伟达AI芯片抱以极大期待,计划使用英伟达开发的“超级计算机”生产出未来几代大型语言模型、Meta AI助手和其他自动化功能等。

the Information援引知情人士称,Meta定下价值至少100亿美元的订单,而Microsoft最近几周将其订单规模增加了20%。Microsoft 计划在 2025 年第一季度之前为 OpenAI 准备好 55000-65000 个 GB200 芯片。

NVLink 服务器机架或受影响

设计缺陷还将影响 Nvidia NVLink 服务器机架的生产和交付,因为从事服务器工作的公司必须等待新的芯片样品,然后才能最终确定服务器机架设计。

此前,天风国际分析师郭明錤就指出,GB200 NVL36的算力优势无庸置疑,但也面临许多前所未见的设计与生产挑战,能否确保如期大量出货,答案存疑。

GB200 NVL36的每个机柜耗电约80kW,而根据AMAX今年四月的调查,目前全球少于5%的数据中心可以支持每机柜50kW服务器。所以,购买GB200 NVL36前,需先确保有没有足够空间安装。

GB200 NVL72的单一机柜版本,每机柜耗电130kW,短期内无法量产。

编辑/Jeffy

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

英伟达 Blackwell AI芯片 设计缺陷 延迟发布
相关文章