
作者:电子创新网张国斌
3月25日,全球规模最大、规格最高、最具影响力及最新技术热点全覆盖的半导体“嘉年华”——SEMICON China 2026国际半导体展在上海正式拉开帷幕。SEMI中国总裁冯莉在致辞中指出在AI算力以及全球数字化经济驱动下,全球半导体产业迎来了历史性时刻,原定于2030年才会达到的万亿美金芯时代有望于2026年底提前4年到来。

她指出2026年半导体产业的三大趋势。第一个趋势:AI算力。2026年全球AI基础设施支出将达到4500亿美元,其中推理算力占比首次超过70%,由此拉动GPU、HBM及高速网络芯片的强劲需求,而这最终都转化为对晶圆厂和先进封装以及设备和材料的强劲需求。第二个趋势:存储革命。存储是AI基础设施核心战略资源,全球存储产值将首次超越晶圆代工,成为半导体第一增长极。2026年HBM市场规模增长58%至546亿美元,占DRAM市场近四成,需求的徒增,导致供需失衡,尽管三星、SK海力士、美光三大原厂已将70%的新增/可调配产能倾斜至HBM,但HBM产能缺口达50- 60%。第三个趋势:技术驱动产业升级。随着2nm及以下制程逼近物理极限,遭遇量子隧穿与栅极控制难题,GAA架构边际效益递减 ; 一座2nm晶圆厂建设成本超250亿美元,逼近7nm时代的3倍。先进封装的战略位置凸显,“先进制程+先进封装”的双轮驱动,从系统层面推动产业升级。
她的讲话实际上表明“存储”已经不是配角,而是AI时代真正的“系统瓶颈+价值锚点”。这是因为:
一、AI时代的本质变化:从“算力中心”走向“存储中心”
过去十年,半导体产业的叙事核心是计算(Compute-centric):
CPU → GPU → AI加速器
但在大模型时代,范式发生了根本变化:、
AI系统的真实瓶颈,不再是算力,而是“数据搬运能力”、
具体表现为三点:
模型参数爆炸:GPT级模型已进入万亿参数规模
数据访问密度提升:推理阶段访问频率远高于训练
内存墙(Memory Wall)再次出现,而且更严重
★ 结果很直接:算力在等数据,而不是数据在等算力
二、为什么说“存储成为战略资源”?不是容量,而是带宽
传统理解里,存储=容量(GB/TB),这是PC/移动时代的逻辑。
但AI时代,关键变量变成:带宽(Bandwidth) + 延迟(Latency) + 能效(Perf/W)
这也是HBM爆发的根本原因。HBM的本质价值,不是“更贵的DRAM”,而是:把内存“贴”到计算芯片旁边(2.5D/3D封装)通过TSV实现超宽总线(1024-bit以上)带宽提升一个数量级(TB/s级)
★ 换句话说:HBM不是存储升级,而是“算力架构的一部分”
这也是为什么:GPU ≈ Compute + HBM 的组合体,没有HBM,高端AI芯片基本失去意义。
三、AI推理爆发,进一步放大存储价值
冯莉提到一个非常关键的点:推理占比首次超过70%这对存储意味着什么?
训练 vs 推理,对存储的不同要求:
阶段 | 特点 | 对存储需求 |
|---|---|---|
训练 | 批量计算 | 容量 + 带宽 |
推理 | 高频访问 | 低延迟 + 高带宽 + 高缓存命中 |
★ 推理的本质是:“持续、小批量、实时访问模型权重”
这直接带来三大变化:
HBM需求持续刚性增长(不仅是训练)
DDR / LPDDR重新被激活(边缘推理)
CXL内存扩展开始进入实际部署周期
四、存储正在吞噬半导体利润池
存储产值将首次超越晶圆代工,这背后其实是利润结构重构:
① AI系统成本结构变化
过去服务器成本:CPU为主,DRAM/SSD为辅
现在AI服务器:GPU + HBM占比超过50%,网络 + 存储成为关键瓶颈
★ 本质变化:存储不再是成本项,而是性能决定项
② 产业权力重新集中
当前格局非常极端:DRAM:三星 / SK海力士 / 美光,HBM:几乎被SK海力士+三星垄断
★ 结果:AI时代最“卡脖子”的,不只是先进制程,而是HBM产能,供需缺口50–60%,本质上就是:AI需求增长速度 >> 存储产能扩张速度;而HBM扩产难度 ≈ 先进逻辑(甚至更复杂)
五、先进封装:存储真正的“放大器”
先进封装,本质上是“让存储成为计算的一部分”
典型路径:
CoWoS(台积电)
I-Cube(三星)
Foveros(Intel)
这些技术的核心,不只是堆芯片,而是把HBM、Logic、IO做成一个系统级SoC;所以:未来的竞争,不是芯片 vs 芯片,而是“封装级系统 vs 封装级系统”。
那问题来了,“AI时代最大赢家到底是GPU厂,还是存储厂?”欢迎大家留言讨论!
注:本文为原创文章,未经作者授权严禁转载或部分摘录切割使用,否则我们将保留侵权追诉的权利