一夜之间,AI算力规则变了:英特尔押中下一个十年?

作者:电子创新网张国斌

过去几年,AI算力几乎被一个公式定义:GPU越多,模型越强。但现在,这个公式正在失效。

在Computex 2026上,一个被忽视的变化浮出水面——一个Agent的Token消耗,最高可以比传统单轮推理高出1000倍。这意味着什么?意味着AI的瓶颈,正在从“算得快”,变成“调得动”。

当计算从一次性推理,变成持续的“思考—规划—执行—反思”,真正决定效率的,不再只是GPU,而是——谁来组织这一切?

而这,正是英特尔押注的方向。

在Computex 2026大会上,英特尔CEO陈立武发表了主题演讲。他回顾了英特尔在过去五十多年带来的一系列创新成果,以及x86架构长期以来作出的贡献。陈立武表示:“五十多年来,英特尔携手生态合作伙伴,持续推动PC、互联网以及如今AI时代关键基础技术的发展。当前,随着推理、智能体和物理AI加速演进,英特尔正不断推进从芯片到系统级的创新突破,为产业升级和社会发展注入新动能。我们很高兴与合作伙伴携手打造卓越产品,更好地服务客户,让更多人共享AI发展带来的新机遇,共同创造更美好的未来。”

随着 AI 模型训练日趋成熟,以及越来越多的 AI 应用投入生产实践,行业对具有成本效益和高能效的 AI 推理的需求呈指数级增长。而Agentic AI的兴起,使得这一推理需求进一步攀升,不仅重塑了数据中心的算力格局,更让 CPU 重新回到了主导地位。

Creative Strategies首席执行官兼首席分析师Ben Bajarin指出: “在模型训练时代,AI 部署中CPU与GPU的配比大致接近1:4,而智能体推理则将这一比例改写为接近1:1(甚至GPU占比更低)。”

为在系统级层面把握这一趋势,英特尔、SambaNova和富士康今天宣布,计划构建基于英特尔至强处理器的机架级 AI 基础设施,以满足数据中心、超大规模数据中心及智能中心的部署需求。

这几家公司现场展示了已具备量产条件的机架,这些机架将英特尔至强处理器与 SambaNova SN-50 RDU 紧密结合,旨在提供高性能 AI 推理的同时,显著提升成本效益与能效。作为此次合作的一部分,富士康将为这一全新机架级AI基础设施提供系统集成支持。此外,针对无需额外加速的工作负载(包括成本优化型推理、数据处理和混合 AI),富士康还计划制造一款高 CPU 密度的机架级基础设施变体。

PC生态持续创新

英特尔客户端计算与物理AI事业部新任负责人Alex Katouzian登台介绍,作为基于Intel 18A制程打造的首款产品,第三代酷睿Ultra处理器集完整的XPU体验于一体,包括快速响应的CPU、高吞吐量的GPU以及低功耗处理的NPU,为高端移动处理器性能、图形处理及续航表现树立了新标准,目前已应用于消费级和商用级超过325款设计方案中。

第三代英特尔酷睿处理器采用与Ultra系列相同的IP架构,具备全天候续航能力、丰富的接口连接性,以及出色的性能表现,并以超薄机身呈现高端质感,为主流PC市场带来卓越体验。

酷睿Ultra处理器家族最新产品——英特尔锐炫G3系列处理器,基于第三代酷睿Ultra处理器相同的架构打造,并针对掌上游戏场景优化设计,在提供强劲续航和稳定性能的同时,带来沉浸式的游戏体验,将于本月晚些时候逐步上市。

边缘计算与物理AI的广阔机遇

Intel 18A制程已在边缘计算领域获得超过130项设计合作,英特尔在制造、具身智能、零售等行业拥有超过4,000家边缘生态合作伙伴,边缘部署共计超过10万项。

英特尔计划自边缘计算拓展至包括具身智能、自主机器及其他AI设备等领域在内的新型物理AI形态。

从云端到边缘的混合AI计算优化方案

隐私、可靠性、合规、成本等因素驱动着对混合计算的需求。在混合计算模式下,敏感数据的推理可以在本地设备完成,需要更大规模计算和更多上下文支持的工作负载,则交由云端处理。

Perplexity首席执行官Aravind Srinivas介绍了Perplexity率先为推理编排打造的混合本地服务器,该服务器能够根据设备能力与功能特性,在本地与云端环境之间动态扩展工作负载。此次在Computex上所展示的能力,目前仅适用于搭载英特尔处理器的Windows PC版Perplexity应用程序。

专为数据中心打造的全新处理器

谈及通用计算,人们首先想到的往往是英特尔,因为x86架构已为数据中心提供动力逾五十年。

英特尔公司执行副总裁兼数据中心事业部总经理Kevork Kechichian发布了英特尔至强6+处理器。至强6+处理器是基于Intel 18A制程打造的首款数据中心CPU,它搭载了288颗能效核,配备高达576MB L3缓存,可提供业界领先的计算密度与能效表现,对于需要兼顾AI就绪能力与日常关键业务负载的企业而言,具有至关重要的意义。

迈向机架级系统与智能计算中心

最新研究预测,到2030年,AI推理工作负载所消耗的电力,将占据数据中心总电力需求的近40%。当Agentic AI开始融入真实工作流程、数据、工具以及治理等环节,计算基础架构也亟待变革,这是因为Agentic AI是可迭代的,需要经历“思考、规划、行动和反思”的过程。

这种工作负载的转变催生了CPU需求的快速增长,因为CPU需要对整个推理过程进行编排和协调。由此,原本前沿模型训练中CPU:GPU 1:8的配比,已在Agentic AI中演变为1:1乃至更高的CPU密度需求。

接下来,陈立武阐述了如何重塑计算,即跳出单一部件的视野转向机架级系统,从而应对Agentic AI工作负载的需求。

富士康首席产品官Jerry Hsiao介绍,富士康正携手英特尔及其合作伙伴,为专为推理和Agentic AI工作负载设计的机架级AI基础设施提供系统集成能力。

在Agentic AI场景中,CPU与GPU比例趋于稳定的同时,Token用量正呈爆发式增长。据最新报告显示,与单轮推理相比,一个智能体的Token消耗量最高多1000倍。因此,在CPU之外,提供专为Token消耗与生成优化的计算解决方案至关重要。

为此,英特尔近期宣布与SambaNova、Vista Equity Partners及Cambium Equity展开合作,提供成本效益高、能耗低的推理解决方案。

SambaNova首席执行官Rodrigo Liang就公司与英特尔近期宣布的合作内容进行了更为细致的讲解。Vista Equity Partners的Robert Smith则介绍了各家公司计划如何利用来自英特尔、NVIDIA和SambaNova的全新机架级AI基础设施,通过名为Vector Core Compute的全新推理云服务,向客户提供完全解耦的推理能力。

面向客户工作负载的定制芯片

尽管新的机架和云解决方案有望重塑推理和Agentic AI的经济模式,但企业越来越将自身的工作负载视为战略资产,并寻求专为其特定业务需求打造的定制芯片。英特尔高级副总裁Srini Iyengar介绍了英特尔在定制芯片领域的进展,包括与谷歌合作推出IPU,这些芯片对于云服务提供商实现性能提升至关重要,以及与爱立信等电信客户合作,在全球范围内提供先进的无线基础设施芯片。

行业专用垂直解决方案

定制芯片正成为垂直解决方案的基础,帮助客户满足特定行业的需求。陈立武介绍了英特尔如何与Hitachi、Siemens、Echo Neurotechnologies 及 Greenstone Biosciences等公司合作,在能源、工业自动化、生物医学工程和药物研发等多个领域实现革新突破。

以芯片构建智能世界

陈立武在主题演讲结尾表示,面向 PC、边缘与物理 AI、数据中心以及新兴智能中心等生态领域,英特尔及其合作伙伴仍拥有广阔机遇。从硅片、系统级芯片到系统和应用,英特尔为现代计算奠定了坚实基础。与此同时,英特尔正持续加大投入,在现有和新兴领域持续拓展新的业务空间,并与多个行业深化全新合作。在合作伙伴的支持下,英特尔正携手各方,在由硅构筑的世界之上,共同迈向更加智能的未来。