Supermicro 与 Arm 携手推进智能体 AI 时代的计算创新

在近期的 COMPUTEX 大会上,Supermicro 宣布推出全新服务器产品,旨在满足智能体人工智能 (Agentic AI) 时代快速增长的计算需求。该系统搭载 Arm 三月底推出的 Arm AGI CPU,能够为新一代 AI 推理及智能体工作负载提供业界领先的计算密度与能效。

AI 基础设施正迈入推理时代

自 2022 年底 ChatGPT 问世以来,业界对 AI 基础设施的讨论主要围绕 GPU 展开。过去几年,数据中心的扩张也主要由大规模模型训练所需的加速算力部署所驱动。然而,AI 技术格局正在快速演进。与主要聚焦于模型训练的第一阶段 AI 部署不同,智能体 AI 工作负载呈现出持续性、分布式和推理驱动的特点,这类工作负载要求系统能够大规模处理编排、检索、推理和实时决策。

这一转变正推动基础设施的新需求,其中高效的 CPU 计算在最大化整体 AI 系统性能方面发挥着基础性作用。随着工作负载从训练转向推理,并日益迈向自主化、多步骤的智能体 AI 系统,CPU 正成为现代 AI 基础设施的关键组成部分。

智能体 AI 带来了一种全新的计算特征。与传统的聊天机器人式交互不同,智能体系统可跨多个服务与模型,持续完成推理编排、内存访问、信息检索、任务规划与协同交互。这些工作流对高效通用计算、内存带宽以及 I/O 可扩展性产生了巨大需求,并需要与 GPU 加速协同配合。

为应对这一转变,Arm 推出了 Arm AGI CPU。该处理器基于多达 136 个 Arm Neoverse V3 核心打造,配备最高速率达 8,800 MT/s 的 12 通道 DDR5 内存以及 PCIe Gen6 连接,并在 300W 功耗范围内实现高性能设计,旨在为以 AI 优先的数据中心提供卓越的计算密度与能效。Arm 测算数据显示,凭借出众的单核性能、高核心密度、出色的单核内存带宽以及行业领先的能效水平,Arm AGI CPU 可实现单机架性能达到同级别 x86 平台的两倍以上

专为下一代 AI 工作负载打造的基础设施

Supermicro 的新一代服务器及机架级产品组合,将 Arm AGI CPU 的能力进一步落地,覆盖云、企业及边缘等多元部署场景。

ARS-142TP-QNR-LCC

其中,面向超大规模、新型云 (neocloud) AI 基础设施,Supermicro 发布了液冷 Open Rack Wide (ORW) 平台——ARS-142TP-QNR-LCC。一台满配的 ORW 机架可支持多达 336 颗 Arm AGI CPU,为云规模的智能体 AI 和推理工作负载提供极高的计算密度。

ARS-242TP-QNR-LCC

而针对采用 Open Rack V3 (ORV3) 环境的客户,Supermicro 推出了液冷 2U4N ORV3 服务器——ARS-242TP-QNR-LCC,每机架可支持多达 168 颗 Arm AGI CPU,同时保障现代数据中心的部署灵活性。ORW 和 ORV3 系统预计将于 2027 年第一季度提供样品,2027 年第二季度实现量产。

ARS-212HE-FNR

除液冷解决方案外,Supermicro 还将 Arm AGI CPU 的支持扩展至风冷环境。针对功耗和空间受限的边缘部署场景,单插槽 ARS-212HE-FNR 短深度服务器为分布式 AI 推理和边缘计算应用提供了优化的平台。该系统预计于 2026 年第四季度提供样品,并于 2027 年第一季度实现量产。

面向通用计算工作负载,双插槽 2U ARS-222H-NR 服务器在标准 19 英寸外形规格下,支持最高八块 NVMe 硬盘和额外的加速器扩展。该系统广泛适用于各类数据中心工作负载,包括 Web 与应用服务、数据库与分析、虚拟化和云基础设施,以及媒体和内容处理等应用场景。

ARS-522GP-NR

与此同时,5U ARS-522GP-NR 平台面向高性能 AI 推理部署场景,支持多达八张加速卡,并配备双路 Arm AGI CPU 和高密度 NVMe 存储。这些平台预计于 2026 年第三季度提供样品,并于 2027 年第一季度实现量产。

这些平台的推出凸显了一个重要的行业转变:AI 基础设施的未来将不再仅由 GPU 性能定义。随着智能体 AI 在企业及云服务提供商中的规模化应用,融合高性能 CPU、加速器、内存带宽和高效系统设计的均衡架构将变得至关重要。

与此同时,能效和数据中心可扩展性正变得日益关键。随着企业在云、本地企业机房和边缘环境中广泛部署 AI,基础设施必须在实现更高计算密度的同时,避免功耗与散热需求无节制的攀升。而这正是基于 Arm AGI CPU 打造的平台所具备的显著优势:在提供可扩展的 AI 算力的同时,提升每瓦性能。

凭借基于 Arm AGI CPU 打造的一系列解决方案,Supermicro 正在助力客户构建适配智能体计算实际场景、深度优化的 AI 基础设施,覆盖从超大规模推理集群,到企业机房及边缘部署的广泛场景。随着行业向能够自主推理、协作与执行的 AI 系统迈进,高效 CPU 计算与加速型 AI 基础设施的结合,将成为下一代数据中心的基石。