ARM:大小核架构继续引领SOC

在ARM公司6月16日深圳举办“2015 ARM Tech Forum”上,ARM移动市场全球营销总监James Bruce和ARM处理器部门市场营销总监Ian Smythe接受了媒体的采访,就移动设备市场发展趋势和ARM处理器技术发展进行了交流, 并分享了ARM big.LITTLE架构最新发展。
James表示,目前全球已经付运的基于ARM内核架构的SoC超过600亿颗!几乎有70亿移动用户在使用基于ARM处理器的设备,仅2014年就出货了14亿只基于ARM处理器的智能手机。
当然,ARM也没忘和和老对手X86处理器做了一个对比,5年前,每年有1.7亿X86处理器设备出货,而当时基于ARM处理器的设备出货是1.8亿,现在,5年后,每年有2.39亿基于X86处理器的设备出货,但基于ARM处理器的设备出货已经飙升到16.4亿!“ARM推动了移动设备在显示、连接、照相、视频、CPU、GPU、存储器带宽方面的创新。”James表示,“ARM营造的生态系统让围绕ARM的厂商一起创新,而不是像友商那样只是自己在玩。” 他指出这其中的一个创新就是ARM推出的 big.LITTLE架构,它可以应对移动设备日益复杂功能带来的功耗问题。 1市场上有很多基于ARM Cortex A57很棒的设备 在处理器迈入64时代后,采用大小核架构的SoC升级到ARM最早推荐的Cortex-A57和Cortex-A53,但是初尝头啖汤的高通810却遭遇发热问题。 就在昨天,三星的某位市场人员还发微博揶揄采用高通810的手机,称“高通810的手机,冬天可以热卖,因为可以少带一个暖宝宝云云,并说索尼Z4内部温度高达86度!”
James表示,我们看到市场上有很多基于ARM Cortex A57很棒的设备,三星Galaxy S6就是其中之一。 三星Galaxy S6搭载的是2.1GHz的八核Exynos 7420处理器(四颗Cortex-A57+四颗Cortex-A53),但是Exynos 7420处理器采用的是14nm FINFET工艺,而高通810采用的是20nmHPM工艺,两者在工艺上差别很大。
实际上,在我参加的某国内厂商的手机新平台发布会上,他们就表示,当时在评估A57时发现它的能效比并不高----就是提升的性能带来了功耗的大幅度提升,所以他们改用了增强版的A53而不是A57. 据说还有一些采用A57A53大小核架构的SoC通过把A57降频实现了低功耗,但是这样等于降低了性能,没有特别的意义。 2Cortex-A57将被大小核架构抛弃,未来是A72+A53架构? James表示去年推出的Cortex-A72的性能大大提升,同时考虑的功耗的优化。同样采用20nm工艺,其功耗比A15,A57降低很多。
James也表示A72+A53的大小核架构组合会比A57+A53功耗降低很多,他表示,由于A72是后推出的架构,因此早期客户都选择了A57+A53的架构但是近来客户选择A72+A53架构的越来越多。因为这个架构会大幅度降低功耗。
最新的信息显示,海思的Kirin 950将采用16nm制程, 基于四核Cortex-A53+四核Cortex-A72核心,频率最高2.4GHz,整合的GPU则是Mali-T880,ISP支持的像素提升到4200万,LTE基带则提升到Cat.10级别,支持450Mbps网络。 在跟Marvell的人员交流时,他们也表示,会推出基于A72+A53的六核架构手机处理器,而前段时间我在跟高通一位内部人员交流时,他也表示高通820将不会采用ARM公核架构,估计高通这会被A57搞怕了,他们在820会采用自家的64位Kryo架构,主频可高达3.0GHz。 这样看来,A57内核将被抛弃? 3big.LITTLE架构继续引领移动SoC架构 Ian Smythe表示,数据显示即使采用了1个大核+四核小核的架构,也可以将处理器的性能大大提升,如下图所示,采用了1个大核+四核小核架构,也比四个小核(4L)有提升40%的性能。
James表示目前看来大小核架构是提升用户体验的最好的架构模式,在PC领域应用的多线程技术,难以应用到移动处理器,因为移动处理器采用的多是浅流水线架构而不是深流水线架构。 4CCI-500支持四个CPU簇,未来将会有更多核处理器? 为支持big.LITTLE大小核继续发扬光大,ARM于今年2月推出了缓存一致性互连架构CCI-500,这个技术比以前CCI-400有很大提升,CCI-500最大的变化就是增加了一个“探听过滤器”(Snoop Filter),从而使探听控制不再局限于单个簇内部的CPU之间,可以扩展到整个处理器的所有核心,也就是A72/A57、A53全部覆盖。
这样一来,处理器需要执行的缓存查询工作量就会大大减少,效率自然随之增加,最终的好处就是互连过载降低、CPU核心空闲时间更多。互连所需的内存带宽也会因此大幅度减少,ARM宣称CPU一端的内存性能可提升30%。ACE(AXI一致性扩展)端口的数量也翻了一番,系统带宽因此增加一倍,可轻松搞定4K显示输出。 而且CCI500最多支持的CPU簇也从2个增加到4个。理论上讲,你可以在一颗处理器内塞进四组处理器! 比现在的联发科Heli(曦力)X20十核处理器更猛,X20是采用了三簇架构,把任务分成了大 中小来处理。 ARM设想未来的处理器架构是这个样子的
未来还有比十核更多的处理器吗?James表示ARM不会去预测有多少核,但是目前在单线程情况下,多小核是比较有效提升性能的方式,核的多少要根据用户应用需求而定。 声明: 本文为原创文章,转载需注明作者、出处及原文链接,否则,本网站将保留追究其法律责任的权利