南京智算中心:基于浪潮分布式存储,加速释放数据潜能

《人类简史:从动物到上帝》作者尤瓦尔.赫拉利认为:人类从石器时代至21世纪的演化与发展,经历了四个阶段,即认知革命、农业革命、人类的融合统一和科学革命。当前,人类正在迎来第二次认知革命,智能计算的人工智能时代!

从无人驾驶,到精准医疗;从智能客服,到智慧城市。智能计算驱动着社会变革,我们也已跨越弱人工智能,步入强人工智能时代的前夜,在这一快速发展的行业浪潮中,全球产业界也纷纷转型,抢滩布局人工智能创新生态。

据IDC预测:到2024年,中国在全球人工智能市场的占比将达到15.6%。中国人工智能产业将成为全球市场增长的重要驱动力。

智算中心:经济新动能,社会新基建   

7月14日,南京智能计算中心在南京市麒麟科技创业园落成并投入运营,中心由浪潮与寒武纪携手合作,打造了业界领先的“一中心、一底座、N平台”模式,即一个算力支撑中心、一个PAAS生态拓展底座;N个应用平台,重点支撑科技金融、智能制造、智慧零售、智能医疗、智慧交通等领域应用创新。为政府、企业及科研院所等多方用户提供智能计算软硬件资源共享及调度、交叉研究支撑、大数据应用、统一安全管控以及产业创新集聚等五大功能性服务。

1.jpg

据浪潮和IDC联合发布的《2020-2021中国人工智能计算力发展评估报告》显示,在我国2020 AI算力TOP 10中,长三角5座城市上榜,南京赫然在列。南京智算中心的落成无疑将为长三角地区乃至全国数字经济到智慧经济变革,带来充沛动能。通过与政府和企业共同致力研发智慧城市行业AI解决方案,依托平台提供创新创业、教育科研、资讯分享、论坛大赛等服务,构建智能计算的生态合作圈,促进人工智能技术与传统产业结合,进一步推动南京及长三角地区的人工智能行业发展。

南京智能计算中心解决方案在功能设计方面,遵循模块化、标准化、广泛兼容、自主安全可控、智能高效的设计原则和理念,针对多学科交叉耦合的现状和未来的发展趋势,有效地设计和配置系统硬件结构,从而使硬件配置架构和科学软件的需求特性相匹配,最大限度地发挥硬件的能力,提高运算效率,并满足未来发展和系统升级的要求。在建设中采用新一代人工智能计算集群架构,通用性和专用性相结合、近期和远期相结合,同时探索存储、计算、算法领域研究的热点和前沿,满足智能计算业务平台对信息化基础设施需求的同时优化其功耗及运营、运维成本,共同推动南京市智能计算产业发展。

根据南京市委市政府印发的《南京市打造人工智能产业地标行动计划》,到2025年南京人工智能核心产业规模将达到500亿元,带动相关产业规模5000亿元。发展成为全省第一、全国前三、全球有影响力的人工智能创新应用示范城市。

释放数据潜能,有足够大的算力?

据IDC在发布的《2020-2021中国人工智能计算力发展评估报告》中指出:在数据、算法、算力这三个人工智能要素中,算力已成为驱动AI产业化和产业AI化发展的关键要素;同时,近年来,算法模型的复杂度呈现指数级增长趋势。由此可见,进入智能时代,算力和数据正变得越来越重要。

有足够大的数据?在这样一个万物互联的时代,对位于长三角经济区的南京来说,全行业快速进入智慧经济变革时代,医院、银行、金融中心、自动驾驶、智慧交通、在线教育、智慧医疗、智能机器人、智能客服等,数据的增长呈指数级。

有足够大的算力?7月,南京智算中心落地,计算能力达每秒80亿亿次(800P OpS)。这也是长三角当前投运的最高性能的智能计算中心。

南京智能计算中心人工智能计算平台整体系统架构包含2 层,分别为浪潮智能集群硬件设备、寒武纪人工智能算力平台。浪潮智能集群硬件设备为整个智能计算中心解决方案提供基础硬件支撑,包含智能计算单元、数据存储单元、网络交换单元、支撑管理单元、信息安全单元这五个部分,提供 AI 算力、通用算力、高性能交换网络、全闪存储、分布式存储、信息网络安全等方面的基础支撑服务。

高速计算存储网络承载智能计算服务器及存储节点互访带宽需求,连接着整个计算系统、存储系统,是智能计算平台中网络最重要的部分,采用分层组网、高可用网络架构,计算服务器节点与存储节点进行冗余链路设计,25Gb 网络速率接入,接入交换机采用 100Gb上行连接至汇聚交换机,汇聚交换机通过 100Gb 冗余链路与核心交换机实现互联。

2.jpg

云存智用,运筹新数据

信息技术的发展带来数据的爆炸性增长,毋庸置疑,我们已经全面跨入大数据时代,PB 规模的非结构化数据越来越常见,如何有效地运筹管理这些数据,并进一步发掘数据价值,已成为必须重视的问题。

南京智算中心打造统一平台,设立AI算力资源池、算法资源池,构建统一的算力和算法调度平台,通过智算中心运营和生态链建设丰富算法资源池,支撑各行业AI智能应用的训练和推理。南京智算中心运行过程对存储系统性能和稳定性要求极为苛刻,存储系统要承载百亿小文件的读写,满足深度学习平台上万个客户端连续稳定的高并发访问,满足AI训练中GPU或CPU计算集群的高带宽、低延时的并发访问要求;随着业务部署量线性增长,数据存储量也将PB级增长甚至可达EB级,南京智算中心对存储设备扩展能力也要求极高;复杂的AI模型构建过程会涉及数据采集、预处理、训练推理和仿真等操作,不同环节对应不同协议的存储服务,需要一套存储支撑一个智算中心,显著缩短AI模型生成时间。

浪潮分布式存储AS13000凭借极速性能、极致稳定、极致容量和多协议融合领先性,成为南京智算中心最坚实的数据存储基座。

极速性能,百GB大带宽、毫秒级延迟。浪潮存储AS13000基于iTurbo智能引擎,融合智能IO均衡、智能资源调度、智能元数据管理、智路缓存加速等系统优化模块,实现对IO、路径、数据块、核心等关键要素智能高效调度,为智算中心提供百万级IOPS和百GB大带宽,实现百亿小文件的秒级检索和读取。

极致稳定,99.9999%高可用、端到端保障。浪潮存储AS13000构筑应用层、数据层、系统层的多重数据保护,复杂业务系统运行更稳定,其中业内领先的32+2大比例纠删,空间利用率可达94%,保障系统高可靠且空间利用率更高,4T/H快速重构保障业系统切换前端业务无感知,连续稳定运行。

极致容量,EB 级容量、万亿级数量。浪潮存储AS13000支持横向扩展至5120节点,提供EB级存储空间,且系统性能和容量线性增长,同时存储系统支持多源零拷贝、软拷贝等高级功能,实现存储空间利用效率最高。

极简架构,多协议互通、数据使用效率高。浪潮存储AS13000业界首个推出“多合一”极简架构,同时支持文件、块、对象与大数据四种存储服务,实现多种协议高效互通,一套存储支撑全业务流程,提升整体资源利用效率,并降低多套存储的维护和管理成本。浪潮AS13000一套存储支撑南京智算中心应用,实现AI训练过程多协议高效互通,满足前端百万级文件的快速读取。

智慧时代,智能计算中心通过构建领先的AI算力基础设施,在承载智能化技术创新,促进数据开放共享,加速智能生态建设,带动智能产业的聚合等方面发挥巨大价值。浪潮存储将继续秉承“云存智用,运筹新数据”赋能智算中心,在分布式存储领域加速创新,释放数据价值驱动智能化变革。

稿源:美通社

最新文章