【原创】arm在人工智能的表现令人失望!

winniewei 提交于 周三, 03/07/2018
【原创】arm在人工智能的表现令人失望!

作者:张国斌

昨天,移动处理器领域的领头羊arm公司在北京举行发布会,正式发布了旗下最新一代Mali多媒体套件,包含全新的视频、显示和图像处理器。新的IP套件可与现有基于DynamIQ的CPU和其他Arm IP无缝集成,从而全面实现Arm新一代针对主流移动设备和数字电视(DTV)的解决方案。说实在话,看完这些新品,我的感觉是失望的,在人工智能如火如荼的今天,arm还在改进GPU性能,虽然新发布的Mali-G52 GPU加入了机器学习能力,但是面对独立NPU趋势,arm至今还未推出可以配合异构架构的独立人工智能处理IP,确实令人遗憾。

1

其实arm这样的慢半拍节奏也不是第一次了,回头看看,2013年苹果发布的iPhone 5S带来了全新的A7 SoC,使苹果成为第一个迈入64位移动计算时代的手机厂商,迫使众多ARM芯片厂商不得不快速跟进,而arm是在2012年年底才推出首款64位ARMv8架构的Cortex-A50处理器系列产品,采用这个架构的处理器到2014年才能面市,用到手机上要到2014年年底,比苹果慢了一年多,这样的慢节奏坑了很多厂商,受害最深的是高通,当时为了抢时间,结采用了ARM公版架构结果搞出来一个发热奇大的810 ,让高通损失很大,所以后来高通抛弃了arm公版架构转回用自己的架构了。

2

其实高通也是有苦说不出啊。如果arm早点推出64位架构,高通也不至于为了抢时间去用公版架构了。

3

AI时代arm再次落后

自去年开始,人工智能技术已成燎原之势,尤其是中国厂商,抓住了人工智能的基于,推出了大量人工处理技术的产品,例如寒武纪、麒麟处理器、地平线等等。从跟很多处理器大佬交流来看,大家倾向于把人工智能单元做独立加速单元的异构处理方式,意味着人工智能处理器和现在GPU,VPU一样,可以单独工作也可以和CPUGPU协同,例如几家已经商用的处理器如海思的麒麟970就是这样的架构。

4

联发科在MWC2018上发布的P60也是类似异构架构(看最下面的APU--人工智能处理单元)

5

而苹果A11则是配备了生物神经网络引擎(A11 bionic neural engine),每秒运算次数最高可达6000亿次。该芯片赋能的最重要的事情就是使 Face ID 身份认证功能能够快速识别人脸,从而解锁 iPhone X 或进行购物。

所以,从处理器厂商的实际方案来看,大家倾向于用CPU+GPU+独立NPU(神经网络处理加速器)的模式,面对这样的趋势,arm显然落后了,至今没有推出这样的IP,倒是Imagination在被苹果抛弃后仍然励志地率先推出了这样的IP。详见《今天,Imagination在中国首发布了一个划时代的人工智能产品》。

6

我看是arm的日子过得太舒坦了吧 ,被软银收购后衣食无忧了,把厂商的需求都忘了,还在一板一眼的按自己的节奏出东西吧。当老大似乎不该这样吧,否则主流厂商在人工智能时代顶多就选用你的CPU和GPU了!以现在手机处理器厂商来看,华为、联发科、高通在人工智能处理方面都没有用arm的技术,而瑞芯微等则采用了CEVA的DSP,一些基于AI的智能语音识别芯片如杭州国芯的GX8010也是内置了gxNPU,不过也是自己开发的,没arm的事儿。

7

可能有人说,Arm有DynamIQ技术啊,实际上arm去年发布的DynamIQ技术是重新定义多核架构。是ARM big.LITTLE技术的重要演进。DynamIQ big.LITTLE能够允许对单一计算集群上的大小核进行配置,当然,DynamiQ还包含了一系列针对机器学习和人工智能进行优化的全新处理器指令集,可以加速人工智能在各个领域的普及程度。但这个“加速”,主要通过对CPU和片上系统两方面性能的提升来实现。虽然第一代采用DynamiQ技术的Cortex-A系列处理器在使用优化指令集后,可以实现比基于Cortex-A73设备高出50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。但是和真正独立NPU来相比,这样的提升并不显著,而且还是利用的是CPU、GPU的资源。还是那句话,术业有专攻,针对人工智能技术应该有专门的加速器来出来各种算法更合适。

1991年,当arm在英国一个谷仓成立的时候,12位创始人精准地预测到了移动低功耗时代的需求,27年过去了,人工智能时代已经来临,希望arm不忘初心,早日为你们的众多客户推出走心的产品来,不要只干些修修补补提高点性能的事情!

注:本文为原创文章,转载请注明作者及来源

相关文章