英伟达芯片“倒爷”们,开始不发朋友圈了。
2023年大模型火热的时候,“倒爷”们朋友圈的画风是“欲购从速、30%定金,有实力的老板来!”到了2024年就变成了“现货现款、物美价优。”甚至有一批人已经黯然退场。
以H100整机价格为例,官方售价为30万美元左右,水货一度高达300多万人民币,超过50%的利润空间,让不少人趋之若鹜,但是现在价格已经回落到230万人民币左右,再倒卖也就没什么利润空间。
其中既有英伟达芯片更新换代的原因,基于Blackwell架构的GB200等新品单位算力成本更低;也有算力行业从过热到回归理性的必然,有了GPU并不意味能转换成大模型算力,大家对这一现实的理解,是用真金白银砸出来的。
大模型之大,动辄需要64/128/256台服务器(一台服务器8张GPU卡)组成的算力集群来训练。对于志在基础大模型的厂商来说,万卡集群成了入门门槛,不仅海外OpenAI、马斯克的xAI等都在规划十万卡集群,国内也同样走在竞逐十万卡集群的路上。
来自需求端的压力,也正在重新校正AI算力产业,首当其冲的便是智算中心。作为计算、存储、网络的集合体,智算中心直接反映大模型算力的行业现状,而来自一线的声音趋于一致:智算中心太“多”,大模型不够用了。
缺算力是真的,空置也是真的
智算中心并不是绝对意义上的“多”,无论从各种视角看,真正适配大模型训练的算力在未来一段时间仍有很大的缺口,大规模智算中心的建设不会停止。
以OpenAI为代表,ChatGPT发布两年来,大模型产业发展的脚步似乎变慢了,不排除这是大模型新一轮爆发前的蛰伏,在“Scaling Law”(规模法则)信仰之下,xAI、Meta、Op










