发布时间:2024-10-30 08:25:28 来源:金年会jinnian6766
芯东西6月20日消息,据The Information报道,据出席会议的人透露,去年圣诞节前后,英伟达创始人兼CEO黄仁勋与高管召开了一系列会议,讨论一个日益增长的担忧:
AWS、微软等云服务供应商最近几个季度一直在购买英伟达约一半的AI服务器芯片。黄仁勋担心这些供应商的进展速度不够快,无法建立新的数据中心和电源来容纳他们订购的芯片。
英伟达的一名员工以及几位客户和数据中心运营商称,会议结束后,英伟达经理加快了步伐,询问云提供商是否有足够的空间和电力来满足他们的订单。
数据中心提供商DataBank的首席执行官Raul Martynek称:“除非客户能够证明他们拥有放置这些GPU的数据中心容量,否则英伟达不会提供GPU。”
英伟达最新财季取得了惊人的增长和利润,市值超过3万亿美元。但在成功背后,黄仁勋和他的同事们还专注于应对英伟达的下一个威胁——对英伟达芯片的需求最终放缓的可能性。
为了防范这种可能性,英伟达已开始向AI开发人员销售更多软件,一年前甚至成立了自己的服务器租赁业务DGX Cloud。此举使其直接与大客户云供应商们竞争。DGX Cloud在从这些云供应商租赁的英伟达驱动的服务器集群上运行。然后,英伟达以更高的成本将服务器租给自己的客户,并承诺他们更好的计算性能。
这在行业内造成了紧张局势。AWS最初拒绝让英伟达在AWS数据中心内开拓自己的竞争业务。但在所有较小的竞争对手都同意英伟达的条件后,AWS让步了,表示将提供其他云供应商尚未拥有的较新英伟达AI芯片的DGX Cloud。在芯片难以获得时,AWS也可能担心会惹恼关键供应商。不过AWS发言人Patrick Neighorn称,这个说法是猜测性的,是不正确的。
当黄仁勋管理新的软件和云工作时,他仍然意识到一个可能影响销售的因素:购买他的芯片的大型科技公司正在进行大量投资,但回报不确定。
微软、Meta、马斯克的xAI以及其他公司正在使用芯片来训练实验性的新AI模型,这些模型不会立即产生收入。当Meta CEO马克扎克伯格承认4月下旬收入的不确定性时,随着投资者对这种情况感到不满,该公司的股票大幅下跌。投资者的压力可能会促使其中一些公司撤回对芯片的购买。
考虑到这些问题,黄仁勋一直在仔细管理英伟达如何分配芯片,以免哪家公司积累太多芯片。他还试图影响客户在数据中心组装GPU的方式,促使他们遵循英伟达认为将带来更好计算性能的服务器机架设计。
但一些客户认为,如果以后这样做,遵循英伟达的建议将使客户更难改用竞争芯片。一位参与谈判的人士说,这导致与关键客户微软就云供应商计划如何安装英伟达即将推出的芯片存在周期性对峙。
英伟达还希望尽可能多地从连接其芯片的服务器的电缆、机架和其他硬件中榨取收入,这可能会牺牲服务器制造商的利益。
去年8月,英伟达首席财务官Colette Kress称,新业务已经有望每年产生数亿美元的收入。3个月后,她说,2023年,新业务每年产生超过10亿美元的收入,这意味着他们现在贡献了英伟达总收入的1%左右。相比之下,其核心服务器芯片业务去年创造了475亿美元的收入。
5月,英伟达披露,它已承诺花费近90亿美元从客户那里租用云服务器,主要用于内部研发,但也用于促进其云服务租赁业务。一些客户和前员工认为,这项业务最终可能会使英伟达免受芯片低迷的影响,并使租用其服务器的客户更难寻求替代芯片。
前英伟达高管、现在是风险投资公司Playground Global的合伙人Sasha Ostojic说,云计算和软件产品“被分析师和技术界低估了”,因为它每年可能产生数百亿美元的收入。他说,“英伟达拥有所有杠杆”,它需要发展与芯片互补的服务。
据参与这些讨论的一位人士透露,去年秋天,英伟达甚至考虑为DGX Cloud租赁自己的数据中心。此举将完全切断云供应商。英伟达最近还聘请了Meta高管Alexis Black Bjorlin来负责云业务,目前还不清楚英伟达是否计划为DGX Cloud建设自己的数据中心。
同时,英伟达的销售人员在不遗余力地了解客户正在使用英伟达的芯片做什么。他们最近问云供应商的问题包括他们的客户是谁、他们签署了什么样的承诺来租用这些服务器。这些答案可以帮助英伟达提前制定销售计划,也可以帮助它了解自己的云服务租赁业务的潜在客户。
除了潜在的利润丰厚的收入来源外,DGX Cloud还已成为英伟达帮助其一些客户过渡到新一代芯片的一种方式。例如,软件制造商ServiceNow过去曾为自家数据中心购买英伟达服务器,现在也直接从英伟达租用这些服务器。
去年,当对GPU的需求旺盛时,ServiceNow总裁C.J. Desai跟黄仁勋说需要更多的服务器。黄仁勋告诉他:“这完全没问题,但你应该能够将容量扩展到DGX Cloud。”
Desai称,ServiceNow的AI雄心“非常依赖”英伟达的产品,包括今年早些时候推出的帮助企业在其应用程序中高效运行AI的软件。Desai不想讨论他的公司在产品上花了多少钱,只透露说金额一直在增长。ServiceNow拒绝了竞争云和芯片公司的报价,因为其工程师非常喜欢英伟达的“全栈”。
英伟达发言人说:“我们每天都向客户证明我们的价值。英伟达为客户提供最低的总拥有成本、卓越的性能和创新,在堆栈的每一层——从芯片到系统再到软件和算法。”
风险投资家Jeff Herbst认为:“英伟达从不自满。”他在英伟达工作了二十年,负责业务发展和收购,直到2021年,“你无法从会议的语气或主旨真正知道时间是好是坏。”
英伟达31年前开始销售用于PC游戏系统的GPU。黄仁勋在2006年推出了一种利用图形芯片提供的计算能力的编程语言CUDA,为英伟达最近的崛起奠定了基础。
CUDA通过自动化构建利用芯片的应用程序的过程来节省开发人员的时间。近年来,CUDA已成为英伟达销售的一个主要因素:数百万程序员不想费心学习如何用竞争对手的芯片编程。
黄仁勋也有过失误,包括为自动驾驶汽车开发软件,而不仅仅是芯片,这涉及雇用一支庞大的工程师团队。这个计划没有成功。但英伟达在2019年以70亿美元收购Mellanox Technologies后得到了提振,这使其在企业数据中心站稳了脚跟,其AI芯片越来越多地出现在企业数据中心。
OpenAI推出的ChatGPT在微软数据中心使用英伟达芯片,为这家芯片制造商引发了几乎前所未有的繁荣。大量的大型科技公司和开发人员都在争相使用GPU来开发自己的生成式AI模型。英伟达还为数十家此类开发商提供了资金,包括Mistral、Cohere、Runway、Wayve、Figure、Perplexity等。
黄仁勋一直在管理与微软等公司的棘手关系。这些公司购买英伟达的芯片,同时试图减少对这些芯片的依赖。为一家主要云供应商工作的人以及几家数据中心运营商的高管称,微软、AWS及其他云供应商已经经历了对传统计算工作负载的需求复苏,因此他们无法承担仅仅为了容纳英伟达芯片而扩展数据中心的费用。
一次性销售芯片的业务存在固有的脆弱性:随着需求不可避免地冷却,尽管销售量迅速上升,但它们可能会下降。
对于英伟达来说,没有稳定的新利润流的未来可能并不美好:正如许多评论家所言,2000年,思科在互联网泡沫最严重的时期销售路由器,突然成为世界上市值最高的公司,当时电信公司建造了新的数据中心,但由于基于互联网的收入未能像科技高管和投资者想象的那样实现,这些中心被闲置了。随着其硬件成为一种广泛使用的商品,思科尚未从销售下降中恢复过来。
Sun在20世纪90年代成为服务器和计算机硬件的巨头,但在泡沫破裂后,该公司没有抓住微软和其他公司占领的蓬勃发展的软件市场。
过去几个月,英伟达推出了几种软件产品,希望其业务多样化。在2月份的财报电话会议上,黄仁勋将英伟达AI Enterprise业务描述为“AI操作系统”,客户可以用它来训练和运行AI。英伟达对每个GPU每年收取4500美元的软件访问费用。
“他不是在销售芯片,而是在为现代数据中心销售GPU、软件和系统。”曾是Mellanox董事会成员的风险资本家Umesh Padval说,“人们认为它只是一家GPU公司,但它远不止于此。”
可以肯定的是,英伟达的硬件销售不会面临迫在眉睫的风险。由于其先进技术,该公司在截至4月的9个月中创造了400亿美元的自由现金流,并称对今年晚些时候将推出的下一个旗舰芯片的需求正在飙升。
即使软件业务的增长速度没有英伟达希望的那么快,它也可以提高对公司芯片的忠诚度,并保护其核心业务免受更便宜的竞争对手的影响。
存储公司Box的首席执行官Aaron Levie说:“如果你是英伟达,你真正想要的是一个非常强大的更好的软件服务飞轮,让客户留在你的轨道上。”Box租用英伟达GPU并向自己的客户转售英伟达运行AI的软件。“我认为(黄仁勋)在这方面做得很好。”
在试图建立新软件业务的同时,黄仁勋正试图努力实现硬件销售增长的最大化,同时确保没有任何一个客户能够凌驾于英伟达之上。这也许可以解释上周的公告,即相对较小的云服务器供应商甲骨文将获得大量英伟达芯片,并在明年初开始将其租给微软和OpenAI。微软更愿意直接购买这些芯片,不过一位了解这笔交易的人说,它可能很难为这么多新芯片找到空间和动力。
黄仁勋还与另一家小型云供应商CoreWeave保持着特殊关系。该公司的收入从2022年的2500万美元飙升至去年的数亿美元。此前它以牺牲云大厂的利益为代价获得了大量英伟达GPU。微软还不得不从CoreWeave租用GPU服务器容量以满足其需求。
为了创造更多硬件收入,英伟达正试图对其最大客户如何购买和安装GPU产生更大影响。通常,云大厂构建自己的客户服务器机架,用于全球数据中心和各种芯片。但参与谈判的几位人士称,当英伟达就其下一个旗舰芯片GB200接洽客户时,它试图说服他们完全按照其设计购买机架。
微软和英伟达今年在这个问题上争了几周。据参与谈判的人透露,英伟达副总裁Andrew Bell要求微软的同行购买一个服务器机架设计,该设计与微软在其数据中心使用的机架尺寸相差几英寸。这种变化将阻碍微软在不同AI芯片之间轻松切换的能力。Bell称,同意购买英伟达服务器机架设计的客户可以率先获得其新芯片,但微软高管对此反对。
参与其中的一位前微软高管说,微软高管已经感到购买英伟达网络电缆的压力,因为他们认为英伟达将优先考虑此类采购,而不是只涉及其GPU的采购。截至2023年初,英伟达网络芯片和电缆约占微软在英伟达产品上支出的1/3。
其中一名参与者称,关于服务器机架设计的争议最终到达了微软首席技术官Kevin Scott和首席执行官Satya Nadella的办公桌。最后,英伟达做出让步,同意让微软为GB200芯片设计自己的定制机架。
参与该计划的两名英伟达员工透露道,英伟达今年计划设计和采购装有GB200芯片的服务器和机架的材料,然后再将它们交给建造并最终销售这些芯片的服务器制造商。
这可能会对戴尔、惠普、超微等服务器制造商的利润率带来压力。一家大型服务器汇编商的经理称,这些公司从他们设计的机架中产生的利润率高于使用英伟达的设计。
GPU业务还面临另一个问题。虽然大公司拥有处理英伟达先进芯片的专业知。