【原创】GTC大会给国内GPU、AI公司的七点启示

作者:电子创新网张国斌

GTC大会(GPU Technology Conference)是英伟达主办的全球顶级AI与加速计算开发者盛会,汇聚了开发者、研究人员、企业领袖等,旨在探讨如何利用AI应对挑战并推动各行业发展。它始于2009年,每年举办,因其对产业风向的决定性影响而被视为AI领域的“年度盛会”或“AI界春晚”。

1 (1).png

2026年度的GTC大会于2026年3月16日至19日在美国加州圣何塞举行,本届大会的核心是推动AI从新技术转变为真正的基础设施,并重点发布了包括Vera Rubin计算平台、智能体工具及物理AI解决方案在内的多项重磅技术与战略。‌‌那本届英伟达GTC给国内算力和GPU公司带来哪些启示呢?我认为有七点:

一、战略层面:从"卖芯片""卖系统"

核心启示:英伟达已将竞争维度从单一芯片提升至全栈系统

英伟达发布的Vera Rubin不是一个GPU,而是包含Vera CPURubin GPUBlueField-4 DPUNVLink互联网络、光子以太网及HBM4内存的完整计算系统。黄仁勋明确表示,单靠GPU算力堆叠已难以解决AI计算瓶颈,真正的限制来自内存带宽、互联延迟及计算存储协调效率。

国内公司应借鉴:

打破芯片边界,构建系统级竞争力:不要只盯着算力TFLOPS,而要像华为昇腾、海光那样,发展CPU+GPU+DPU的异构协同能力

提前布局互联技术:英伟达NVLink已成为其护城河,国内需加速自研高速互联协议(如华为HCCS),避免被PCIe带宽瓶颈制约集群扩展

重视内存墙问题:英伟达与三星、SK海力士深度绑定HBM4,国内应推动长鑫存储等厂商加速HBM技术突破,或探索CXL、存算一体等替代方案

二、技术路线:从训练优先到推理优先的战略转向

核心启示:AI产业正从"学习为中心"转向"推理为中心"

黄仁勋强调,AI正在成为"能够阅读、思考、推理和行动"的系统,AI Agent执行实际任务的时代已经到来。这导致数据中心从"存储空间"转变为"生产TokenAI工厂"

国内公司应借鉴:

调整产品路线图:英伟达已从Hopper/Blackwell(侧重训练)转向Vera Rubin(侧重推理),国内芯片设计需强化低延迟推理和高吞吐服务能力,而非单纯追求训练算力

关注稀疏化和量化技术:英伟达强调单Token成本降至1/10,国内应发展结构化稀疏、FP8/FP4低精度计算、动态批处理等推理优化技术

布局边缘推理:英伟达发布RTX PRO 4500 Blackwell服务器版本(TBP降至165W),显示其向边缘延伸意图。国内应抓住端侧AI机遇,发展低功耗推理芯片

三、生态建设:软件护城河比硬件更难逾越

核心启示:CUDA生态20年积累形成难以撼动的护城河

黄仁勋庆祝CUDA诞生20周年,并强调TokenAI时代基础单元。更关键的是,英伟达通过NemoClaw/OpenClaw构建AI智能体时代的"新计算机",类比WindowsPC时代的地位。

国内公司应借鉴:

从兼容到原生:不要仅满足于CUDA兼容层(如HIP),而要像华为昇腾CANN一样,构建原生优化的软件栈,在特定场景(如大模型推理)实现超越CUDA的性能

拥抱开源模型:英伟达发布Nemotron 3系列开源模型(吞吐量效率提升5倍),并与DeepMind合作更新AlphaFold数据库。国内应积极参与开源生态,通过模型-芯片协同优化建立影响力

发展垂直领域SDK:英伟达在机器人(Isaac GR00T)、自动驾驶(Alpamayo 1.5)、医疗(BioNeMo)均有专用框架。国内可聚焦智能制造、智慧城市等优势场景,打造垂直化软件生态

四、商业模式:从硬件销售到"AI工厂"运营

核心启示:英伟达预测到2027年底AI芯片收入将达1万亿美元,其核心是构建"AI工厂"基础设施

国内公司应借鉴:

提供整机柜解决方案:英伟达NVL144机架就是一台超算,国内厂商应学习其将计算、存储、网络、制冷整合为即插即用模块的能力,降低客户部署门槛

发展算力租赁/云服务:英伟达与AWS合作部署超百万块GPU,显示其向服务化转型。国内可联合云厂商,提供基于自研芯片的AI算力服务,验证芯片可靠性

构建开发者社区:英伟达GTC吸引2.5万现场参会者及30万线上参会者,国内应举办类似技术大会,培育开发者生态

五、前沿布局:押注物理AI与具身智能

核心启示:英伟达将"物理AI"作为下一波浪潮,构建从仿真到部署的全栈能力

英伟达发布Cosmos 3世界基础模型、Isaac GR00T N1.7人形机器人模型、Alpamayo 1.5自动驾驶模型,并与比亚迪、吉利、宇树科技等中国企业合作。

国内公司应借鉴:

发展数字孪生能力:英伟达Omniverse用于机器人和自动驾驶仿真训练,国内芯片需强化与物理仿真引擎的协同,支持合成数据生成

瞄准机器人计算平台:英伟达Jetson Thor专为机器人设计,国内应开发针对具身智能的高算力、低延迟边缘计算平台

抓住车规级芯片窗口期:英伟达DRIVE Hyperion平台已聚合比亚迪、吉利等车企,国内芯片商应加速通过车规认证,进入自动驾驶供应链

六、供应链策略:垂直整合与开放合作并行

核心启示:英伟达既深度整合关键供应链,又保持生态开放

英伟达与台积电合作1.6nm A16制程,与三星/SK海力士锁定HBM4供应,同时选择英特尔至强6系列作为DGX Rubin头节点,显示其灵活的合作策略。

国内公司应借鉴:

确保先进制程产能:英伟达Feynman将采用台积电1.6nm,国内需加速国产先进制程(如中芯国际N+2)与Chiplet技术的结合,规避制程限制

发展先进封装:英伟达Feynman将采用3D堆叠封装,国内应投资CoWoS3D IC等先进封装产能,这已成为性能提升的关键

构建本土供应链联盟:英伟达与铠侠合作GPU直连闪存,国内应联合长江存储、长鑫存储等,发展CXL内存扩展、存算一体等替代方案

七、NVIDIA 携手全球工业软件巨头,将设计、工程与制造带入 AI 时代

英伟达与Cadence、达索系统、西门子和新思科技正在打造由 NVIDIA 驱动的 AI 智能体,用于规划、优化并验证复杂的芯片与系统工作流程。同时,FANUCHD 现代集团、本田、捷豹路虎、凯傲集团、梅赛德斯奔驰、联发科技、百事公司、三星、SK 海力士 和 TSMC 正在采用 NVIDIA CUDA-X 与 GPU 加速的工业软件及工具,加速工业设计、工程开发与制造流程。

这样,工业软件将不再只是“设计+仿真工具”,而是 集成智能体、自动优化、预测分析的“工业智能平台”。软件供应商的价值链竞争将从算法功能竞争,转向 AI 智能体能力、GPU 加速能力以及跨平台整合能力。GPU 驱动的高保真仿真将成为标配,未来三到五年内,CFD、电磁仿真、结构力学仿真等将从“小时级”或“天级”加速到 分钟级或秒级。对汽车、航空航天、半导体甚至能源行业,意味着研发周期缩短 310 倍,产品上市速度显著提升。

给国内公司的启示,也做横向和纵向深度整合,以算力推动行业效率提升。

所以,英伟达的成功不仅在于技术领先,更在于其系统性思维——将芯片、软件、网络、存储、应用整合为不可分割的AI基础设施。国内公司需避免"单点突破"思维,转而构建垂直整合、水平开放的生态系统,方能在全球AI算力竞赛中占据一席之地。

2.jpg

One more thing,此外,在2026年的GTC大会上,黄仁勋着力强调“Tokens per Watt(每瓦特令牌数,简称Token/W)”这个概念,老张认为这个很有价值,让算力真正回归到其本质而不再是参数,其核心意义与价值在于,它为正在爆发的AI智能体(Agent)时代,确立了一套全新的、从“工程思维”转向“经济学思维”的度量衡。这标志着AI竞赛的焦点,已从追求极致的算力峰值,转向了追求极致的能效与商业回报。

过去,我们习惯用FLOPS(每秒浮点运算次数)来衡量芯片的算力,这像用“马力”评价发动机,关注的是理论上的“力气”有多大。但黄仁勋提出的Token/W,则将视角转向了整个AI工厂的投入产出比。

它将两个核心要素联系了起来:

Token(AI的产出单位):无论是生成一段文字、编写一段代码,还是让AI智能体执行一个复杂的推理任务,最终都可以量化为Token的生成和消耗。Token是AI世界的“硬通货”。

Watt(能源的投入单位):在电力成为数据中心最大刚性约束的今天,电力就是AI生产中最主要的“原材料”成本。一个1GW的数据中心,其电力上限是物理定律决定的,无法改变。

因此,Token/W这个概念的意义在于,它将衡量标准从“我的芯片算力有多强”,转变为“每一度电,能为我产生多少有价值的智能产出?” 。这是一个从工程师视角向CEO视角的转变。Token/W概念的提出,带来了深远的价值影响。

这样,数据中心不再只是成本中心,而是一个直接创造收入的“印钞厂”。AI的盈利能力,直接取决于将每一瓦电转化成Token的效率。

而Token作为“硬通货”将形成不同等级。黄仁勋预测了从每百万Token 3美元到150美元的五个定价层级,对应不同的模型能力、上下文长度和响应速度。企业可以根据自身业务需求,采购不同“品质”的Token,就像采购不同等级的电力或原材料,让AI服务市场变得更加精细化和专业化。

这个概念的提出也与大家关心的AI智能体(Agent)发展息息相关。随着OpenClaw这类智能体框架的爆发,AI将从回答问题转向替你执行任务,这将导致Token的消耗量呈指数级增长。一个简单的对话消耗的Token极少,而一个能帮你订机票、写周报、做研究的AI智能体,其背后消耗的Token量将是前者的成千上万倍。

正如黄仁勋所预言的,未来每家公司的工程师入职时,可能都会领到一笔相当于半年薪资的“年度Token预算”,用于调用各种AI智能体来完成工作。届时,Token/W就不再只是一个技术指标,而是决定一家公司乃至一个国家在智能时代核心竞争力的关键所在。

对此,大家怎么看?欢迎留言讨论!(完)

注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利