深入分析ARM最新DynamIQ多核微架构

作者:电子创新网 张国斌 今天,ARM正式发布了全新DynamIQ技术,可能由于翻译问题,我们都把DynamIQ理解成了一个技术,在回深圳的飞机上我仔细研究了英文资料,发现今天理解上有个错误,其实DynamIQ技术就是一个全新单集群多核微架构,它针对人工智能做了优化,也对功耗,灵活性(可以自己设置大小核结构),存储和计算架构都做了新的设计,有新的指令集,所以下一代的CortexA处理器可以采用这个架构设计多核处理器。特此说明。在下面的文中我会把DynamIQ技术改称DynamIQ微架构。
深入分析ARM最新DynamIQ多核微架构
深入分析ARM最新DynamIQ多核微架构
今天,ARM在北京举办盛大媒体发布会,邀请大陆、台湾地区以及日本媒体参加,隆重发布了全新的DynamIQ微架构。估计很多人已经在朋友圈看到了这个新闻(新闻还是称DynamIQ技术),不过可能80%的人看完之后都会有个疑问?这是个啥技术?肿么没看懂?结合现场老张和其他媒体的提问以及和ARM发言人ARM计算产品事业部总经理Nandan Nayampally的私下交流,我分析下这个新技术。 01、为什么选在北京发布? 这个自然是跟客户有关,目前中国半导体市场已经占据全球半导体市场近乎2/3的市场,而且中国大陆IC设计业蓬勃发展,IC设计公司数量超过1400家,这比全球其他地区IC设计公司总数还多!此外,IC Insights数据显示,大陆地区纯IC设计业者合计销售额占比已由2010年的5%,大幅攀升为2016年的10%。2009年大陆仅有深圳海思半导体一家业者名列全球前50大纯IC设计业者之列。但2016年名列前50大的大陆业者,已有包括如海思、展讯、中兴微电子等11家公司了! 对比大陆纯IC设计公司的显著成长,目前美国业者销售额占比是53%但比2010年的69%已经大幅下滑了16个百分点(主要是受到博通被安华高收购的影响)。而欧洲地区由于CSR、Lantiq和NXP的收购,占比由2010年的4%下滑为2016年的1%!目前欧洲地区名列全球前50大纯IC设计业者仅剩英国Dialog一家。 日本地区主要纯IC设计业者也仅剩MegaChips一家。虽然2016年该公司销售额年增20%,但整体日本地区业者销售额占比,还是由2010年的1%,下滑为不到1%。 另根据“中国半导体行业协会”(CSIA)与“台湾半导体产业协会”(TSIA)最新数据,2016年大陆IC设计业销售额为人民币1,644.3亿元(约合239.1亿美元),已高于同期台湾IC设计业整体产值的新台币6,531亿元(约合202.1亿美元)。所以大陆IC蓬勃发展也是ARM厚望未来1000亿出货的主力军。
深入分析ARM最新DynamIQ多核微架构
因此,抓住中国客户是根本,这也是在中国首发新技术的主因。Nandan Nayampally公开表示按照惯例,大陆客户会在一年后推出采用ARM新技术的产品,而且大陆主要智能手机客户会将率先采用ARM的新技术,所以,毫无悬念的是海思将率先采用这个技术用于麒麟系列处理器,由于支持DynamIQ微架构的ARM Cortex-A系列处理器预计2018年推出,所以,2019年的麒麟990将采用这个新技术! 2、DynamIQ微架构到底是什么技术? 按照Nandan Nayampally的原话来所,DynamIQ多核微架构重新定义了多核设计,代表了多核处理设计行业的转折点,而且其灵活多样性将重新定义更多类别设备的多核体验,覆盖从端到云的安全、通用平台。
深入分析ARM最新DynamIQ多核微架构
我们看到12年前ARM推出了多核的ARM11,第一次实现了单一集群中支持4核的处理器,6年前ARM推出了大小核架构,大核和小核两个集群实现了异构计算集合,两个集群的架构释放了更多计算能力。 到了DynamIQ 单集群微架构,它其实是一个全新架构,可以最多搭配8个不同内核,把芯片级可配置性推上了新的台阶,可以说DynamIQ微架构的推出是ARM big.LITTLE技术的重要演进。自2011年推出以来,ARM big.LITTLE技术为主要计算设备的多核特性带来了革新。DynamIQ微架构也可以继续是使用big.LITTLE架构,以“根据不同的任务选择最合适的处理器”的方式来推动高效、智能的多核计算创新。所不同的是DynamIQ big.LITTLE能够允许对单一计算集群上的大小核进行配置,而这在过去是不可能的。例如,1+3或者1+7的SoC设计配置, 现在因为DynamIQ big.LITTLE使其得以实现,尤其在异构计算和具有人工智能的设备上都是需要优先考虑的。这是一个很大的进步。
深入分析ARM最新DynamIQ多核微架构
Nayampally认为在智能手机领域,8核已经可以实现很好的性能,不用更多核。 反而是在企业级应用领域,可以利用Corelink等技术形成3个集群、4个集群、8个集群的多核设计,而且它表示DynamIQ 微架构适合用在企业级应用。 “有了ARM DynamIQ 多核微架构,每个核每个频率可以实现细颗粒度的控制,这意味着我们可以快速让各个处理器实现从开、关到休眠的状态切换,还有内存子系统也做了仔细优化设计只有使用的时候才激活。所以可以对性能功耗比做很好的优化。”他表示。 DynamIQ微架构将用在下一代ARM Cortex-A系列处理器上,这个处理器预计2018年发布!下一代多核处理器就可以采用这个架构了。 3、ARM为什么要推DynamIQ微架构? 毫无疑问,是抢夺人工智能处理器市场! 从今年开始,人工智能将大放异彩深入我们生活的方方面面,Nayampally指出未来5年 基于ARM架构的芯片出货将超过1000亿!要实现这样大的出货量,ARM必须卡位人工智能处理器市场。 在演讲中,Nayampally指出过去22年,ARM已经出货了500亿颗基于ARM架构的芯片; 2005年,ARM全年实现了10亿的出货量 到2010年,ARM实现10亿成为季度数字 到2013年达到每个月10亿出货量 到了2017年的时候,ARM用了4年时间实现了过去了22年的出货量---500亿!四年实现了翻一番的出货量,所以下个5年实现1000亿的出货量不是梦想! 所以ARM预计其合作伙伴将在2021年完成下一个1000亿颗基于ARM的芯片出货,在很大程度上这将归功于人工智能(AI)在人们日常生活中的广泛应用。
深入分析ARM最新DynamIQ多核微架构
Nayampally强调:“ARM是当今行业的架构首选,我们已解决无所不在的计算需求为己任,推动人工智能、自动控制系统的发展,并加速虚拟世界与混合现实体验的整合。为此,我们推出全新的ARM DynamIQ多核微架构,帮助我们的合作伙伴在不牺牲效率的同时实现较以往任何时候都更高的性能表现。” 4、DynamIQ技术如何支持人工智能计算? 提起人工智能,人们很容易联想到NV、赛灵思、英特尔的FPGA,不过Nayampally表示,人工智能其实就是执行一些算法,而DynamIQ微架构支持的V8指令集支持神经网路卷积运算,可以大大提升人工智能和机器学习效率。 他表示第一代采用DynamIQ微架构的Cortex-A系列处理器在优化应用后,可实现比基于Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的响应速度。 “因为目前很多公司开发了特定的人工智能加速器,所以DynamIQ多核微架构有针对加速器的接口,可以大大提升响应速度。”他解释说。“SoC设计者可以在单个群集中最多部署8个核,每一个核都可以有各自不同的性能特性。这些先进的能力会为机器学习和人工智能应用带来更快的响应速度。全新设计的内存子系统也将实现更快的数据读取和全新的节能特性。” 另外,他也特别强调了安全----DynamIQ微架构为ADAS解决方案带来更快的响应速度,并能增强安全性,确保合作伙伴能够设计ASIL-D合规系统,即使在故障情况下仍可以快速恢复并能够安全运行。
深入分析ARM最新DynamIQ多核微架构
Nayampally表示DynamIQ技微架构将被广泛应用于汽车、家庭以及数不胜数的各种互联设备。 从以上介绍可以看出确实是一个新的高性能处理器设计技术,期待它在人工智能领域带来更多变化!
深入分析ARM最新DynamIQ多核微架构