据tomshardware报道,英伟达DGX系统副总裁兼总经理Charlie Boyle出面澄清了该公司GPU产量问题的具体所在。Charlie Boyle表示,问题并非来自英伟达错误计算需求或其制造合作伙伴台积电的晶圆产量问题。
相反,制造足够的GPU来满足消费者和专业工作负载(比如AI)的瓶颈在于随后的芯片封装步骤。英伟达的H系列GPU采用台积电的2.5D CoWoS封装技术,这是一种多步骤、高精度的工程流程,其复杂性降低了在给定时间内可以组装的GPU数量,这可能会不成比例地影响供应;所需GPU数量与可用GPU数量之间的差异甚至导致埃隆·马斯克表示,GPU超级难得。在这之后,Twitter/X采购了多达1万个英伟达计算专用GPU。
因此,当人们使用“GPU短缺”这个词时,他们实际上是在谈论主板上某些组件的短缺或积压,而不是GPU本身。
在芯片成为可用的GPU之前,需要执行从芯片设计到制造的多个步骤。芯片设计阶段的问题可能会因设计疏忽而造成制造瓶颈,从而降低设计的良率(良率是指完全蚀刻的晶圆中可用芯片的百分比)。稀土金属或其他材料(例如最近受到限制的镓)的缺乏将影响长物流链中的其他步骤;材料污染、能源中断和许多其他因素也会造成影响。
但CoWoS的瓶颈问题可能比预想的更严重。台积电本身也表示,预计需要一年半(以及完成额外晶圆厂和扩建现有设施)才能使封装订单积压恢复正常。这可能意味着英伟达将不得不决定将哪些封装能力分配给哪些产品——没有足够的时间和能力来封装所有产品。
一文看懂苹果发布会
供应问题可能来自台积电的封装,但最终英伟达通过其“令人难以置信的执行力”在人工智能领域占据主导地位。就台积电而言,它是少数拥有功能强大的高性能封装技术的厂商之一,而这种技术是性能扩展的绝对要求。AI领域肯定需要更多的竞争(RX 7900 XTX等AMD游戏GPU也被认为正瞄准AI数据中心)。
另外,制造方面也需要竞争。英特尔的代工服务(IFS)有望为高性能GPU领域带来另外的玩家;与此同时,人们还希望三星至少能够缩小其相对于台积电的制造技术差距,使其芯片具有足够的吸引力,以便其他制造商也能加入竞争。