A800、H800是英伟达在华销售的最先进GPU,通常被部署到中国互联网云厂商、大模型公司、智算中心的数据中心,用于AI推理、训练。断供风险下,中国不少公司急抢货
美国升级对华出口管制,波及英伟达在华售卖的最先进GPU(图形处理器)——A800和H800。这两款芯片通常被部署到中国互联网云厂商、大模型公司、智算中心的数据中心,用于AI推理、训练。在迫在眉睫的断供风险下,中国不少公司急抢货,这两款芯片价格飙涨。
“一个多月前,我就听说了美国将升级芯片管制,当时就将下订的AI计算机数量由几十台增至上百台。这两天跟渠道努力沟通,目前锁定了200台,确保公司未来1-2年的AI训练需求。”一家AI创业公司创始人对财新称,“我手里订单都是一个月之前下的,现在下单根本不可能拿到货。即便国内有H800现货,也都在仓库里放着,现在不会拿出来卖了”。
该创始人介绍,10月17日美国升级管制前,一台包含8张英伟达H800训练卡的标准AI计算机现货价格在230万元左右,现已飙至超过270万元,且基本没有现货供应。一名互联网大厂内部人士亦透露,通过中间商从海外带货,单张H800的报价也上涨到35-40万元。
A800、H800是英伟达最先进的两代GPU——A100、H100的中国特供版。A100、H100是如今数据中心、人工智能领域最主流的产品。A100峰值算力超过4800TOPS、带宽达到600GB/s,H100性能较A100更高,按照2022年限芯令,这两款芯片都无法向中国出口。为抢中国市场,英伟达在2022年第三季度投产“特供”中国市场的A800芯片,峰值算力与A100一致,但传输速率被限制在A100的三分之二。此后,英伟达又推出中国特供版的H800,性能稍有差异,重点仍在“阉割”传输速率。
美国时间10月17日,BIS升级限芯政策,将对华出口芯片的参数红线改为“总处理性能”(Total processing performance)。在美《出口管理条例》(EAR)下,集成电路(ECCN代码:3A090)的管制红线为:对于集成电路(不用于数据中心),总处理性能大于等于4800,或总处理性能大于等于1600并且“性能密度”(performance density)达到5.92;对一个或多个数字处理单元的集成电路(用于数据中心),“总处理性能”为2400或以上且低于4800,“性能密度”大于1.6且小于5.92;“总处理性能”大于等于1600或以上,“性能密度”为3.2或以上且小于5.92。“总处理性能”为2 דMacTOPS”ד操作的bit长度”,而“性能密度”为“总处理性能”除以适用的芯片单元(die)面积。(详见财新网《美国升级芯片管制①|从芯片到生产设备,管控如何升级?》)
当日,英伟达披露,上述出口管制修订中对芯片性能阈值的额外许可要求,将影响到英伟达A800、H800等产品,甚至涵盖主要应用于游戏PC(个人电脑)消费级旗舰产品RTX 4090。集成上述芯片的DGX、HGX等计算机系统产品,也为新规所覆盖。(详见财新网《美国升级芯片管制②|美国芯片巨头业务受阻 股价暴跌》)
一名国内头部服务器厂商人士对财新介绍,英伟达10月17日已经停止接单;至于此前的订单,在BIS芯片管制新规的30天宽限期内会继续交付,之后未能交付的可能会取消订单。“即便是浪潮、新华三、超聚变这些服务器OEM厂商向英伟达采购,也就剩这30天的宽限期了,宽限期结束后还没有完成交付就直接取消订单。”
半导体行业咨询机构蓉和咨询CEO吴梓豪对财新介绍,在台积电cowos(即先进封装)仍陷产能瓶颈、全球大算力GPU供不应求的背景下,英伟达原本采取了2023年优先供应国际市场通用版产品,2024年再大批量交付针对中国市场开发的H800等定制产品的策略。“现在看来,英伟达的应对之策就是在30天缓冲期内调度内部资源、冲刺交付,能给中国客户交多少算多少。”
他提及,对于英伟达来说,风险在于这些已在台积电投片的“特供”GPU,只有中国客户肯埋单,“能正常买到A100的客户不会买A800”。新规发布之前,吴梓豪曾测算,英伟达“800系列”GPU在2023年的出货金额约为10亿美元,2024年有望升至50亿美元。
去年10月美国发布半导体出口管制后,国内大模型公司、互联网云厂商、智算中心等主要需求方,就加速对GPU的囤货。百度、字节、阿里等互联网大厂均向英伟达下订、储备算力,并对外提供服务。此次芯片管制新规落地后,已有一些云厂商开始收紧对外算力服务,转而更多支撑内部业务,比如字节跳动。此前字节跳动旗下的火山云希望用手中的部分硬件获取行业客户,借机开拓云业务。财新从接近火山引擎人士处了解到,字节已开始回收此前出租给外部客户的GPU,已经交付的硬件出售项目也面临撤回的可能。
不过,目前,总体上云厂商算力供应正常,各云厂商官网仍可以租用GPU服务器。云厂商的客户——金山办公回复财新称,各大云服务商年初就准备了较大的算力供应,目前也供货正常,公司推理和训练算力充足。
一名国内AI企业芯片策略负责人向财新坦言,中国半导体业界已经认清美国制裁是大势,只是时间早晚、程度深浅问题。当下,企业大多都有了自己的计划,提前进行相应的算力储备及合同安排,因此此次芯片管制新规落地对全行业影响有限。不过,随着未来业务拓展和客户、项目增长,新需求的满足仍是挑战。(未完待续)
本王转自于 财新网