【原创】今天,Imagination在中国首发布了一个划时代的人工智能产品

winniewei 提交于 周五, 09/22/2017
【原创】今天,Imagination在中国首发布了一个划时代的人工智能产品

作者:张国斌

Imagination Technologies 真是半导体产业的励志榜样,在今年初被苹果抛弃后并没有自暴自弃,而是卯足了劲在产品上下功夫,特别重视中国市场,除了在中国地区首发GPU新品外,Imagination 今天还在中国首发了一个划时代的人工智能产品!---它就是完整、独立式硬件IP神经网络加速器PowerVR 2NX NNA !这个绝对是全球第一款神经网络加速器!

“目前,神经网络已被众多市场采用,我们为什么要做一个神经网络加速器?因为NNA除了做图像识别,还可以支持语音识别RNN网络也可以支持其他应用的网络,它就像GPU给图像做加速一样,是个专门做人工智能硬件加速的IP,我们看到华为麒麟970等手机芯片厂商都开始部署独立的神经网络处理器,(详见《深度揭秘麒麟970 人工智能处理器,它的强大超出你想象!》)我们认为未来NNA会成为SoC重要的IP。”PowerVR 产品与技术营销资深总监 Chris  Longstaff 表示。

1

为啥说它是划时代的人工智能产品?

看看这张性能对比图

2

苹果A11 Bionic里的神经网络处理引擎每秒处理相应神经网络计算需求的次数是6000亿次!号称最牛!苹果高级副总裁Phil Schiller曾很有底气的表示:“A11 Bionic是一款智能手机到目前为止所能拥有的最强劲、最智能的芯片。而基于ASIC的深度学习,实现了高准确率之外,还能比基于通用芯片(GPU、FPGA)的方案减少功耗。”

但是,再看看跟PowerVR 2NX NNA的对比!人家是每秒4万亿次!

3

老张看到数据后也是这个表情!

性能提升不是50% 不是100% ,而是数量级的提升,这才是划时代的产品!而且这个NNA是独立的神经网络加速器!就是不需要和其他CPUGPU配合来做人工智能处理!它可以帮CPUGPU做加速,也可以单独存在!

比如智能音箱,里面的DSP就可以不用了,直接用上NNA,比DSP效率要提升很多倍!

当然,它也可以做人脸识别,而且它的效率要比A11高很多,苹果自以为挖走了Imagination的GPU团对就可以搞出更牛的GPU,没想到Imagination高出了更牛的神经网络加速器!库克是该好好想想以后怎么和Imagination继续合作的问题了。

4

 

目前,很多人智能处理主要通过GPU、FPGA来完成,但对于移动端人工智能处理,目前业界还没有好的方案,Chris认为业界还是需要ASIC形式的硬件方案,它可以在功耗和性能上达到一个平衡,所以2NX的推出无疑引领了移动AI的方向。

5

他表示谷歌、苹果、脸书、百度、华为等大型厂商都把AI/NN应用于移 动领域,比如对Android系统的支持将加速其应用,提出带宽、安全和延迟要求在本地处理,而不是云端。有很多不同的视觉和人工智能移动应用程序等等,这些都是AI走入移动端的趋势。而移动端AI需要低功耗、小面积、 MMU和支持Android等。

“PowerVR 2NX是市场上唯一能够满足部署移动解决方案全部需求的IP解决方案、与只有GPU的竞争解决方案相比,小面积PowerVR 2NX结合小面积PowerVR 9XE GPU在同样面积的布局中提供了GPU+NNA 解决方案。”他指出,“PowerVR 2NX地目前最好的移动AI解决方案, PowerVR 2NX也是为移动和Android而设计的,它可以支持目前主流移动CPU和操作系统。”

6

2NX包括硬件IP、软件与工具,可为SoC提供完整的神经网络解决方案。它能有效地执行所有常见的神经网络运算层。依据推理任务的运算需求,它能独立使用 ─ 无须额外的硬件 ─ 或是与CPU和GPU等其它的处理器结合运用。

7

2NX堪称是在线推理的利器!

NNA是怎么炼成的?

看到参数后,很多人都会有这个疑问。老张我也有同样的疑问,会后跟Chris Longstaff交流,他说早在三年前Imagination就已经断定未来基于图像识别的智能应用会走热,因此投入人力进行研究,Imagination的PowerVR 2NX NNA采用了一种一种不同于CPU、GPU的架构,这个架构支持不同位长的数据类型,从16、12、10、8、7、6、5、4位都支持---因为一些汽车应用需要16位支持,而其他的需要较低精度优势。此外,它的权重和激活位宽精度每层均可调节,能以最小功率和带宽实现最大性能。

89

上图显示把位宽调整后,如8位调整到4位,推理吞吐量提升了60%,但是带宽下降了几乎一半,所需功耗也降低很多,但是精度几乎不变。

实际上,2NX可以把带宽需求、PowerVR 2NX NNA 16位支持从128到1024MAC/时钟,8位支持256到2048MAC/时钟,多核扩展可支持到超过2048MAC/时钟,这样以来,它可以设计支持开发具有不同性能点和特性的内核,以满足不同市场和应用需求。

10

Chris 表示包括卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)在内的神经网络正推动各个产业的爆发性技术进展。NNA是一种基本类型的处理器,预计会跟CPU和GPU一样重要,而这两类处理器Imagination均已能供应。NNA的潜在应用不计其数,其中包括AR/VR头戴设备中的特征检测与眼球追踪;汽车安全系统中的行人检测与驾驶员警觉性监控;智能监控系统中的脸部辨识与人群行为分析;网络诈欺检测、内容建议(content advice)、以及预测性UX;虚拟助理应用中的语音识别与回应;以及无人机中的防撞与对象追踪等。

11

随着神经网络日益普及,2NX NNA 这样的专用硬件解决方案 —— 与单纯的DSP解决方案相比,它可提供8倍的性能密度提升 —— 将能以最低的功耗与成本达到最高的性能。此外,一直以来,神经网络非常耗费带宽,因此内存的带宽需求会随着神经网络模型规模的增长而增加。这会为SoC设计人员和OEM公司在设计系统时,因为要提供NNA所需的带宽而带来重大的挑战。PowerVR 2NX能最小化外部DDR内存的带宽需求,确保系统的性能不会受到带宽的限制。

NNA的亮点

12

相比最接近的竞争方案,NNA可提供两倍性能而仅需一半带宽,它是

  • 第一款具备支持从16位到4位高灵活度位宽的专用硬件解决方案
  • 带宽最低的神经网络(NN)解决方案
  • 其架构可支持多种操作系统,包括 Linux和 Android

Chris 表示PowerVR 2NX NNA是可实现最高效率的解决方案,他认为未来AI处理器不应用FLOPS(即每秒浮点运算次数(亦称每秒峰值速度)是每秒所执行的浮点运算次数)指标来衡量,而应以每秒推理或者每时钟执行的卷积运算来衡量,这是通过公布数据把NNA和其他神经网络处理器做的对比。

13

PowerVR 2NX是从头开始全新设计的架构,可提供:

  • 业界最高的单位毫瓦推理 (inference/mW) IP内核,以提供最低的功耗*
  • 业界最高的单位面积推理 (inference/mm2) IP内核,可实现最具成本效益的解决方案*
  • 业界最低带宽的解决方案*——支持权重与数据的高灵活性位宽,包括低至4位的低带宽模式
  • 业界领先的性能,单一内核为每周期2048 MAC,并可采用多核设计进一步提升性能
  • 在硬件架构的基础上提供了最全面的系统级的神经网络解决方案
14

Imagination市场传播副总裁David Harold表示,2NX NNA的推出让面向物联网、监控和安全的神经网络实现成为可能,这样很多时候可以实现移动端的人工智能,而不一定要通过云端进行人工智能处理和决策。

15

NNA未来应用前景

根据嵌入式视觉联盟(https://www.embedded-vision.com)于2017年1月进行的嵌入式视觉开发人员调查显示,79%的受访者表示他们已经利用或正计划利用神经网络来执行其产品或服务中的计算机视觉功能。随着科技持续的快速进展,更多的公司都将能够利用神经网络来开发产品与服务。

Chris表示PowerVR 2NX NNA是专为适应多种市场的推理引擎所设计,其高度可扩展架构适用于未来的更多应用市场。如以下几大场景

  • 移动:随着Tensorflow Lite以及 Android API的即将发布,再加上Caffe2Go架构的快速进展,智能手机AI应用程序数量的快速爆发。公司需要高效率的方式来执行包括影像辨识、语音辨识、计算摄影等在内各种的推理任务。PowerVR 2NX是现今唯一的一套IP解决方案,能以低功耗、小面积、MMU和对Android的支持,来满足移动解决方案部署的所有需求。在GPU不可或缺的移动设备中,公司能把新的 PowerVR Series9XE或 9XM GPU与 2NX NNA在相同的芯片中搭配运用,以作为独立式GPU。其优异的性能足以和业界的独立式GPU竞争。
  • 智能监控:家庭与商业场所安装的监控摄影机数量正大量增加,将推动神经网络视觉处理的需求。基于这些技术的智能型摄影机能被用来根据安全警示、零售分析、人口统计与互动数据来制定决策。考虑带宽需求、数据机密性与其他因素,摄影机的设计必须加入一定程度的“网络边缘”(edge) 视频信息分析处理的能力。由于这些摄影机通常没有GPU或是仅有非常小的GPU,以及较低性能的CPU,因此它们需要一个高效率、高性能的独立式神经网络加速器。2NX NNA是理想的选择,并且具备高度可扩展性,能同时满足消费性与商用的需求。
  • 汽车:汽车的神经网络应用包括驾驶员警觉性监测、驾驶员视线追踪、座位使用、路标检测、驾驶路线分析、道路使用者检测、驾驶员辨识以及其他。随着未来几年自动驾驶汽车与智能型运输系统的数量将日益增加,这些应用将持续扩展。在汽车系统中,需要2NX NNA 这样的完整硬件解决方案,才能满足相关的性能需求。
  • 家庭娱乐:机顶盒和电视将逐渐提供基于神经网络的解决方案,例如能够适应特定使用者偏好的能力,提供自动的儿童锁,以及根据使用者行为自动暂停与录制节目。凭借这些特性,公司能提升其差异性并增加营收。要在这些设备上构建神经网络的关键是高效率的带宽与低成本,以及支持NN API ─ 这些都是2NX NNA的重要特性。此外,还有许多新兴的NNA娱乐应用,包括AR/VR。

NNA让人工智能应用开发更简单

据介绍,Imagination可为开发人员提供所有必要的工具,让他们能快速、轻松地启用和执行其神经网络,并确保运算带宽能与准确度完美平衡。PowerVR 2NX的开发资源包括映射 (mapping) 和微调工具、样本网络、评估工具与文件。完整的 PowerVR NX Mapping Tool 能从业界标准的机器学习框架,包括Caffe 和 Tensorflow,轻松进行转换。高级的网络设计人员将能在2NX NNA 上设计与构建神经网络,以充分发挥其硬件特性。

Imagination也可提供通用的Imagination DNN (深度神经网络) API,能在CPU、GPU与NNA之间轻松转换。此单一的API能够跨多种SoC配置执行,因此能在现有设备上轻松开发原型。

PowerVR 2NX NNA即日起开始提供授权。更多信息,请联系 info@imgtec.com

注:本文为原创文章,转载请注明作者及来源。

相关文章

Digi-Key