Solidigm 成立AI中央实验室,配备高性能、大密度存储测试集群

新实验室汇聚AI与存储专业技术,为Solidigm合作者提供研究和优化存储对AI工作负载影响的平台

企业数据存储领域领导者 Solidigm正式揭幕其 AI 中央实验室。该实验室配备了专为多种AI工作负载量身打造的高性能、高密度的存储测试集群。

这座先进的 AI 中央实验室坐落于美国兰乔科尔多瓦的 FarmGPU 设施内,紧邻 Solidigm 总部。在这里,Solidigm 能够利用NVIDIA B200 和 H200 图形处理器,运行并研究真实的 AI 工作负载。这不仅为我们理解前沿存储技术如何最大限度地提升集群效率,提供了独到的见解,更让 Solidigm 在 AI 生态系统中的重要合作伙伴,有机会在先进的硬件平台上充分开展实验。

Solidigm AI 生态系统与合作伙伴关系高级总监 Avi Shetty 强调:“Solidigm AI 中央实验室将当前强大的 GPU 与领先的存储基础设施融合,为客户和开发者社区开启了前所未有的测试与联合创新篇章。Solidigm 希望这些能力可以惠及更多用户,同时证明了存储与 GPU 紧密集成的重要性与价值。”

该实验室在建设之初便秉持通用参考架构理念,客户可以在一个与全球大型数据中心保持一致标准的环境中,利用 Solidigm SSD测试其解决方案。此外,实验室还将大力推动存储研究,超越传统的组件级测试范畴,更深层次地理解服务器、机架乃至集群层面的真实应用场景。

1.jpg

Shetty 进一步指出:“如今,仅仅进行存储测试已远远不够。在AI 中央实验室,我们能够运行真实场景的AI 工作负载,并借助尖端遥测技术来优化系统性能和效率,以便更深刻地理解新兴工作负载对存储的实际需求。”

AI中央实验室配备了最新的高性能计算硬件,包括:

·高性能存储测试集群:采用超高速Solidigm™ D7-PS1010 SSD,在MLPerf存储(AI模型训练)测试中达到了创纪录的每节点116 GB/s吞吐量,可灵活扩展至多个节点。

·高密度存储测试集群:配备了192Solidigm D5-P5336 SSD,每块容量高达122TB,仅占用16U机架空间即可带来23.6PB的总存储容量。

·其他配置:实验室还配备NVIDIA B200H200 GPU800 Gbps以太网络以及领先供应商的存储服务器。Solidigm也在不断扩展和探索新技术。

实验室可供测试的工作负载包括:

·AI特定及新兴工作负载,例如真实场景下的GPU密集型的AI模型训练和推理,以及KV缓存卸载和VectorDB调优等创新方法。

·实验室能够对不同配置进行功耗基准测试,从而开发出能够高效利用能源的架构。

·实验室可深入研究如何快速向价格高昂的GPU加速器传输数据,使其尽可能保持高负载状态,最大限度释放其算力。

·AI 中央实验室所产生的数据,有助于将SSD的硬件规格,转化为系统层级、与行业应用紧密相关的 AI 效率指标,例如每美元可处理的token和每瓦特可处理的token。

目前,该实验室已与多家机构建立了合作。其中之一是,Solidigm 与 Metrum AI 的专家们携手攻关,成功开发出一种创新技术,能够将 AI 数据从内存卸载至SSD,从而在使用 RAG(检索增强生成)进行推理时,将DRAM的使用量降低高达 57%。

与 FarmGPU 的合作也让 Solidigm 得以持续助力其优化 AI 基础设施性能和效率。如需了解更多关于 Solidigm AI 中央实验室的信息,请访问https://www.solidigm.com/products/technology/ai-central-lab-for-ai-research.html

关于 Solidigm

Solidigm是企业数据存储领域的领导者。凭借数十年的产品领导力和技术创新力,Solidigm正与客户携手推动业务转型,共同迈向以数据为中心的未来。Solidigm在打造创新产品和助力客户成功等领域处于长期领先地位,借助从核心数据中心到边缘的强大端到端产品,为AI等前沿领域的发展提供有力支持。Solidigm SK海力士的独立子公司,总部位于美国加州兰乔科尔多瓦,业务遍及全球。如欲了解有关 Solidigm 的更多信息,请访问[https://solidigm.com],或关注微信公众号[SolidigmChina]