【原创】孤军深入,华为深耕ARM服务器的底气来自哪里?

winniewei 提交于 周四, 09/26/2019
【原创】孤军深入,华为深耕ARM服务器的底气来自哪里?

作者:张国斌

编者注:在2019年华为全联接大会上,华为公布了一系列围绕ARM服务器的新战略,有人认为这是因为遭受美国打压后的备胎之举,其实,华为研发ARM服务器已经近10年,同时在数据库操作系统和数据库软件开发方面也有超过十年的历史,所以这不是什么备胎之举是从联接到计算的必然之路,在万物互联时代,因为,联接与计算密不可分如影随形。

这两天,华为Mate30手机刷爆了盆友圈,其实最近华为还有一件大事,其深远意义远超过了Mate30手机---Mate30顶多给华为带来2000亿的收入,而这件大事可能会给华为带来2万亿的收入!这就是华为公布了围绕ARM处理器架构服务器的一系列重大战略:包括携手本土厂商掘金2万亿美元的智能计算蓝海(详见 《开放开放开放!华为邀你一起掘金2万亿计算产业蓝海》,开放服务器操作系统Euler,开放数据库软件高斯,开放鲲鹏服务器主板等等等等一系列眼花缭乱的操作!在今年华芯通等ARM服务器厂家倒闭之后,业界都不看好ARM服务器,认为其完全难以突破X86服务器的生态体系,此时,华为依然坚持深耕ARM服务器,它的底气和迷之自信到底来自哪里?且容我细细道来。

ARM服务器艰苦发展历程

首先谈点基本概念,服务器是提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在网络环境下,根据服务器提供的服务类型不同,分为文件服务器、数据库服务器、应用程序服务器、WEB服务器等。      x86处理器是执行CISC(复杂指令集)的处理器,它是使用Intel或其它兼容x86指令集的处理器芯片和Windows操作系统的服务器,ARM服务器是采用ARM(RISC指令集)的服务器,它的优势是低功耗、开发成本低、集成度高。

全球服务器市场是个大约230亿美元的盘子,目前基本都被英特尔所占据,份额超过90%,随着大数据和人工智能时代到来,据市场分析预测,从2018年到2025年,数据中心处理的数据每年平均增长达到50%。机器学习和其它AI相关的计算每年更是以10倍的速度增长,约占数据中心总计算量的25-30%。相应地,服务器和高端服务器CPU也将以持续增长,预计到2020年服务器芯片市场规模将超过300亿美元,这么有吸引力的市场自然吸引到很多玩家,大家都想从英特尔手里夺回一些市场。

自2011年以来,多家芯片厂商投入到ARM服务器处理器的研发,但到现在几乎全军覆没!最早的是Calxeda和Applied Micro推出了A15内核的服务器芯片,但Calxeda在2013年已倒闭;Applied Micro经营ARM架构服务器芯片多年最终被通信芯片厂商MACOM收购,其ARM架构服务器芯片业务被拆分。之后AMD、三星、英伟达、博通、Marvell、高通、华芯通等等厂商均大力投入ARM服务器处理器研发,但依旧冲击未果,其中英伟达、三星和博通都终止了相关业务,目前Cavium买下博通的Arm服务器芯片相关IP,继续开发。高通则因为移动芯片业务受阻等被迫放弃服务器芯片业务。高通与贵州合资的ARM服务器芯片公司华芯通也于2019年4月底关闭。

目前,本土ARM服务器芯片仅剩华为与飞腾了,他们都获得了ARMv8指令集架构永久性授权。其中,飞腾的FT-2000Plus采用了台积电16nm制造工艺,主频为2.0GHz—2.4GHz并将DDR4内存控制器集成到了片内,但其量产后只有少数服务器厂商采用,而华为鲲鹏920处理器在2019年1月发布,是面向数据中心高性能处理器,鲲鹏920处理器兼容ARM架构,采用7nm工艺制造,可以支持32/48/64个内核,主频可达3GHz,支持8通道DDR4、PCIe 4.0和100G RoCE网络。

13

在性能上,鲲鹏920已经可以对标英特尔Xeon Platium 8180处理器,其中64核版的鲲鹏920性能超越了8180 ,而48核版的鲲鹏性能追平了8180,但功耗低20% ,更关键的是鲲鹏处理器集成了两路100G网卡至强处理器,这是特别适合海量存储上和云存储,所以华为的鲲鹏定位很清晰,就是主打数据中心的通用处理器和高端存储服务器。下图是鲲鹏920处理器和搭载鲲鹏920的华为泰山服务器和华为OceanStor高端存储服务器。

345

不过,虽然鲲鹏处理器性能和集成度高于X86处理器,但客观的说,ARM服务器的生态还很脆弱,Intel可以说是用开放的工业标准的高性价比处理器打败了所有私有RISC处理器,虽然安腾项目失败,但更高性价比的至强现在完全统治了服务器市场。

ARM试图复制这个模式,但是更开放的硬件生态对比Intel的X86处理器优势不明显,而且多厂商竞争导致力量分散,加上软件生态劣势,可以说ARM阵营目前的竞争力还是比较弱的,虽然华为投巨资深耕ARM服务器领域但是业界并不看好。有网友就有如下评论:

6

是啊,华为真的比高通+NV+三星+AMD都厉害啊?华为的自信来自哪里?

华为的自信来自这5点

参加完三天的华为全联接大会(HC2019)我想我终于明白了华为的自信来自哪里了,总结起来有如下几点:

1、我们正在进入智能计算时代,产业规巨大!这个产业对算力的需求无止境!华为副董事长胡厚崑更指出未来的计算是非常暴力的,另外计算无处不在,“以前说计算在云里,现在看来计从中心侧到边缘侧都有无处不在的计算。需要更好的端边云协同,以更好发挥算力效果、带来更好体验。”他指出,“我们正在进入智能计算时代,未来是计算产业的黄金十年,这个产业的规模超过2万亿美元!”

7

2、算力正从中心节点向端和边扩散

华为Cloud&AI产品与服务副总裁黄瑾指出2018年,全球ARM芯片出货超过230亿片,主要用于端和边,而2018年数据中心通用CPU出货不到3000万片这两者是数百倍的差距。而华为Cloud&AI产品与服务总裁侯金龙预测,2019年华为智能手机总的算力将是今年全球数据中心新增算力的2倍,“端、边算力的巨大优势将牵引生态的发展,进而驱动中心侧计算架构的创新。”他指出。

1

黄瑾表示5G的高带宽、低时延将驱动移动应用走向云化,比如游戏、VR,渲染在云上、交互在端侧。目前,智能手机上有超过500万应用,如果把基于ARM的移动应用迁移基于X86的云端服务器则能损失约40%,而采用同构的ARM则获得40%的性能提升!所以云端服务器采用ARM架构可以解决迁移上的算力矛盾。“以前ARM处理器在数据中心推广的主要瓶颈是性能,而华为发布的鲲鹏920是兼容ARM架构的,由性能超越了业界主流通用CPU 25%以上,所以性能不再是瓶颈。”他指出。

3、开源服务器操作系统OPENEuler、GaussDB OLTP单机版数据库和MindSpore全场景AI计算框架

一台服务器除了CPU、内存和硬盘三大件外 操作系统、数据库和应用软件也很关键,华为在服务器操作系统、数据库研发方面已经有超过10年的历史,这次华为宣布开源操作系统、数据库和AI计算框架,使能伙伴发展自己品牌的产品并为开发者提供覆盖端、边、云的全场景开发框架。

在本次大会上侯金龙宣布华为将于2019年12月31日开源服务器操作系统,2020年6月开源GaussDB OLTP单机版数据库,2020年第1季度开源MindSpore全场景AI计算框架。其中,开源版本的服务器操作系统名称为openEuler,开源版本的数据库名称为openGauss。openGauss数据库可覆盖企业70%以上的数据库业务场景。华为将支持基于openEuler的合作伙伴发行商业版操作系统,支持各行业主流应用和软件开发商把软件和应用迁移到基于openEuler的操作系统上。华为与深之度、中标麒麟、天津麒麟、中移苏研、普华等伙伴计划联合推出openEuler开源社区(http://openEuler.org)。

9

在这次大会上,华为智能计算业务部总裁马海旭发表发布了最新的鲲鹏主板,它搭载两颗鲲鹏处理器,128个物理核,内置100GE RoCE;32个内存插槽,支持PCIe 4.0;合作伙伴可以基于这块鲲鹏主板,开发出多种形态的计算产品。

1

在HC2019大会上,华为副董事长徐直军也来到会场,一睹这款最新主板的真容。        

1

他表示华为在硬件方面有30多年的研发与制造经验,各种硬件主板出货量累计超过10亿块。鲲鹏主板具备业界领先的56G 高速SerDes能力,主板性能提升25%;信号误码率低于10的负12次方,故障率比业界平均水平低15%;通过创新的DEMT动态节能技术可以实现能效比领先业界15%以上合作伙伴基于鲲鹏主板开发的计算产品,具备高性能,高可靠,高能效的优势,可以100%释放整机算力。

鲲鹏服务器还有如下特点:

1、鲲鹏具备“端边云算力同构”优势,打破数据中心与边缘、终端的界限,为开发者提供统一架构的计算平台。

2、鲲鹏具备多核高并发的计算优势,满足大数据、分布式存储、数据库等场景的算力需求,引领IT架构分布式转型趋势。

3、通过鲲鹏+昇腾的协同优势,灵活向AI算力扩展,满足5G、AI、自动驾驶等新技术对多样性算力需求。

3、鲲鹏五级算力加速技术,通过迭代编译、NUMA-aware、消息队列硬加速、函数加速库、内核调度自优化,实现程序性能提升50%。

4、构建鲲鹏产业联盟

 

2

侯金龙在接受采访时指出,“一花独放不是春,百花齐放满园春。”强调了未来华为以协作共赢市场,在本次大会上,绿色计算产业联盟、中国电子技术标准化研究院、安谋科技(中国)、IDC、华为以及产业伙伴共同发布了《鲲鹏计算产业发展白皮书》。作为鲲鹏计算产业发展的行动纲领和指南,该白皮书从产业定位、前景展望、应用分析和发展规划等方面系统性地阐述了鲲鹏计算产业的发展大计。有关《鲲鹏计算产业发展白皮书》的更多信息,请访问http://opengcc.org/forums/194。

胡厚崑在大会主题发言中也指出:“我们面临的是一个2万亿美元的计算产业大蓝海!我们期待的是千帆竞发,而不是独舟奋进。我们期望和各行各业的伙伴共同努力,抓住历史机遇,共创智能新高度。”  

据悉目前很多国内很多服务器操作系统已经可以在华为泰山服务器上运行,利用华为的方舟华为可以轻松编译很多应用,华为也帮助很多应用轻松迁移到泰山服务器上。

而产业和资本也看好厂商和华为的合作,在第二天期间,当清华同方宣布已经采用鲲鹏处理器时,其股票立即拉升已经说明了这点。

4、天时、地利、人和

仅仅在今年年初当你谈论ARM服务器的时候,很多业者都会认为痴人说梦但是随着美国政府加大对中国科技的封锁,采用自主可控的服务器已经是当务之急。

因此ARM架构服务器或者其他架构可以自主可控的服务器都是中国所需要的,华为智能计算TaiShan & Atlas领域总经理张熙伟透露“鲲鹏生态发展进入快车道,在过去的9个月内,华为携手合作伙伴共同完成了超过3000个行业应用向鲲鹏生态的迁移。鲲鹏使能开发者,为每行代码注入改变世界的算力”。这3000多应用中很多是政务、金融、运营商网络、互联网等应用,因此从X86服务器迁移已经成为趋势。

 

3

本次大会发布了华为鲲鹏开发套件包含编译器和三个工具。业界首创的分析扫描工具和代码移植工具实现跨计算平台的自动化应用迁移,让开发者对指令集差异无感,加速应用迁移的同时实现代码优化;性能优化工具面向开发者性能调优实战设计,通过性能可视和一键式优化,帮助开发者工作效率提升5倍。开发者能够在鲲鹏开发者社区一站式获取相关工具和知识库,同时华为云DevCloud云上软件开发平台也集成了鲲鹏开发套件,为开发者提供线上全流程软件研发工具。 

5、启动未来5年的100亿沃土2.0计划,培养500万开发者     

 

4

在本次大会上,华为正式发布了面向开发者的沃土计划2.0,宣布未来5年将投入15亿美金,欢迎广大企业和个人开发者共同参与计算产业的生态发展。并升级发布一站式AI开发管理平台ModelArts 2.0,支持开发者在鲲鹏和昇腾计算平台上进行简单高效的软件开发。

 

5

华为Cloud & AI产品与服务CTO张顺茂表示自2015年首届华为开发者大会发布沃土1.0计划,华为逐步开源开放了CT产品、云服务、昇腾AI计算、鲲鹏计算能力等,并在全球建立21个OpenLab,打造开发者社区,举办开发者大赛和人才认证等,历经4年发展,华为已拥有130万注册开发者个人,超过14000家企业开发者伙伴正在与华为进行产品与方案创新,为客户创造价值。

 

6

张顺茂表示“下一个5年,华为沃土计划2.0将从5大方面进行升级”,产品升级:重点基于鲲鹏+昇腾计算处理器,打造开源开放的计算产业生态;赋能升级:打造360度的全方位赋能体系;联盟升级:推动产业标准,规范,示范点,技术认证体系的建设,共同做大蛋糕;社区升级:按行业建设应用生态,按区域建设产业生态;激励升级:让每个开发者都能获取到鲲鹏和昇腾算力。在LEADS理念的指导下(Lab as Service、End-to-End、Agile、Dedicated、Social),针对开发者开发历程的了解、学习、构建、上市这四个阶段,优化相应流程,社区,资源配置等,使开发者在华为平台上更高效地成长。具体扶持资源包括:鲲鹏开发样机、昇腾训练卡、云服务代金券,OpenLab,培训与认证服务,开发者大赛,ISV应用迁移技术支持,华为FAE开发支持服务,华为认证,ISV营销活动与样板点支持等。华为也将围绕开发者学习、产品构建、产品上市三个阶段,分别设立LDF(学习成长基金)、PDF(产品开发基金)、MDF(市场发展基金)三类基金。

一云两翼双引擎--华为的战略

在这次大会上,侯金龙宣布,华为将以“鲲鹏+昇腾”为根基,打造“一云两翼双引擎”的计算产业布局,持续构建开放生态,以此来实现“为世界提供最强算力,让云无处不在、让智能无所不及”的追求。

7

“一云”指华为云。华为云通过全栈创新提供安全可靠的混合云,成为生态伙伴的黑土地,为世界提供普惠算力。此次共有69款基于鲲鹏的云服务和43款基于昇腾的云服务正式上线,涵盖了IaaS、PaaS、EI、数据库、安全、IoT等领域,帮助客户加速业务创新,实现普惠AI。

“两翼”指智能计算业务以及智能数据与存储业务。在智能计算领域,面向端、边、云,提供“鲲鹏+昇腾+x86+GPU”的多样性算力。在智能数据与存储领域,融合了存储、大数据、数据库、AI,围绕数据的全生命周期,让数据的每比特成本最优、让数据的每比特价值最大。

“双引擎”即是围绕“鲲鹏”与“昇腾”打造的两个基础芯片族,构筑异构的计算架构。其中,鲲鹏主打服务器和PC机芯片,昇腾主打训练和推理芯片。值得一提的是,目前在计算架构中,华为是业界唯一同时拥有“CPU、NPU、存储控制、网络互连、智能管理”五大关键芯片的厂商。

1

华为能成功么?

目前,多变的世界带来诸多不确定性,但是,只要顺应客户需求顺势大势就会赢得市场,进入云时代,服务器大趋势是什么?就是需要低功耗、低成本、高算力的服务器!x86架构的服务器虽然性能强大,但其功耗(>200W/CPU)惊人,数据中心每年的电费吓人,对云服务商来说,性能/功耗比才是更有价值的参数。

另外,火爆的人工智能技术对算力无限需求,华为已经将提升算力列为战略举措,在本次大会上,华为发布了全球AI训练算力第一集群Atlas900 ,AI第一加速卡Atlas300和训练AI算力第一服务器Atlas800等,都彰显了在人工智能处理的实力。而近日,华为创始人任正非在接受《纽约时报》托马斯。弗里德曼采访时指出人工智能将是华为要攀登的下一座大山,也表明了华为在人工智能上的决心。

11

有强大的硬件基础,但华为鲲鹏缺的是应用和生态建设,这方面,华为鲲鹏还有很多短板要补,不过,正如侯金龙所言,“华为一向喜欢走最难走的路。”这条路也许很难,但是方向没有错,坚持下去,一定是有希望的!

日出东方,其道大光,鲲鹏展翅,旭日昇腾!(完)

1

注:本文为原创文章,转载请注明作者及来源

相关文章

Digi-Key