【原创】百亿晶体管麒麟990震撼发布,最全信息都在这里了!

winniewei 提交于 周一, 09/09/2019
【原创】百亿晶体管麒麟990震撼发布,最全信息都在这里了!

文  |张国斌  图 华为公司/自摄

遭美国打压的华为在芯片方面能如何突破?麒麟990有哪些领先性?在移动通信领域业务引领全球、已经走入无人区的华为终端又会将智能手机带到一个什么新高度?9月6日,麒麟990给出了答案!

9月6日,德国柏林,在下半年全球规模最大的消费电子展IFA上,华为消费者业务CEO余承东发表了“Rethink Evolution”主题演讲,正式发布了业界期待已久的华为年度旗舰机平台麒麟990系列---包括全球第一款采用7nm +EUV工艺的5G SoC旗舰机芯片麒麟990 5G和4G版麒麟990两款芯片。麒麟990 5G在性能与能效、AI智慧算力及ISP拍摄能力等方面进行全方位升级,继续打造手机体验新标杆。麒麟990系列芯片将在华为Mate30系列首发搭载。该款产品将于9月19日在德国慕尼黑全球发布。

1

华为麒麟990发布会的主题是“重构”,麒麟990到底要重构什么?如何看待麒麟990的领先性?下面笔者尝试做一下解读。概括起来麒麟990实现了六大领先。

1、工艺领先,全球首款7nm+EUV IC

麒麟990 5G是华为推出的全球首款旗舰5G SoC,是业内最小的5G手机芯片方案,基于业界最先进的7nm+ EUV工艺制程,首次将5G Modem集成到SoC芯片中,面积更小,功耗更低。它在一颗指甲大小的芯片上集成了103亿晶体管,是目前晶体管数最多、功能最完整、复杂度最高的5G SoC,这得益于它采用了目前全球最先进的半导体工艺---7nm +EUV工艺。

12

这是麒麟990实际大小

在先进工艺技术方面,华为自2015年在麒麟950率先采用了业界当时最先进的16nm FinFET工艺之后就一路领先,总是采用业界最先进的工艺技术打造麒麟平台,麒麟980是业绩首款量产7nm工艺的手机平台,这次,麒麟990也率先采用了7nm+ EUV,这也得益于华为和台积电坚实的战略级合作伙伴关系。

在EUV工艺演进上,麒麟芯片早在2014年就开始了EUV技术的储备,联合产业界合作伙伴共同研发并促进EUV技术成熟。为了让最新的EUV工艺能够带给消费者稳定可靠的高品质体验,麒麟990 5G在实现高性能和高能效的基础上,进行了大量关键技术验证,为手机用户提供最可靠的技术保障。

今年5月26日,台积电首席执行官表示该公司7nm+ EUV已开始批量生产,这是台积电第一次、也是行业第一次量产EUV极紫外光刻技术。虽然对外没有宣称是什么产品采用这个工艺,但是现在看来可能当时量产的就是麒麟990。

7nm+ EUV量产成功也意味着半导体工艺再次跃上新的台阶。从余承东实际公布的数据看,采用这个工艺的麒麟990基于7nm +EUV 板级面积缩小  36%功耗,虽然有103亿个晶体管但是芯片尺寸比同类竞品都小30%左右。

4

麒麟990和同类产品尺寸对比

2、通信性能全球领先 超越对手PPT新品

在先进工艺的支持下,同等面积大小的IC可以塞下更多晶体管,麒麟990也成为首颗晶体管数量超过100亿的5G SoC芯片,而衡量一个芯片领先性的重要指标之一就是晶体管数量,另外,麒麟990率先支持NSA/SA双架构和TDD/FDD全频段,充分应对不同网络、不同组网方式下对手机芯片的硬件需求,是业界首个全网通5G SoC。

基于巴龙5000卓越的5G联接能力,麒麟990 5G在Sub-6GHz频段下实现领先的2.3Gbps峰值下载速率,上行峰值速率达1.25Gbps,带来业界最佳5G体验

在麒麟990正式发布之前,曾有两家友商发布也发布了5G SoC芯片,一家是三星电子,它在9月4日发布了号称采用8nm的首款集成5G基带的移动SoC芯片Exynos 980,该芯配备两颗Cortrex A77大核(2.2GHz)和四颗Cortex A55小核(1.8GHz),GPU为Mali G76 MP5。---这个参数也低于麒麟990的参数指标后文有介绍。

5

在通讯性能方面,三星称Exynos 980可以在Sub 6GHz频段的5G网络下最快达到2.55Gbps,4G最高1Gbps,双模并行达到3.55Gbps。

但是很奇怪的有两点:

1、目前支持5G标准(4MIMO/256QAM调制等。。。)的理论极限下载极限是2.3Gbps,但是三星号称搞出了2.55Gbps的下载速度,不知道这个速率咋么来的,三星也未做任何解释,在我质询三星中国之后也没有得到答案。

华为手机产品线副总裁李小龙也表示,因为基于3GPP R-15协议标准,100MHz带宽能实现的理论速率最高为2.34Gbps。基于这个限制,在过去无论华为、高通还是MTK,对外宣称的速率都是2.3Gbps。今天有厂商突破了这个极限,一定有什么奇迹发生。

2、没有公布芯片实际面积大小。

另外,该芯片要到年底才开始量产,实际上目前仅仅是样片阶段。采用该芯片的5G手机要到2020年年中面市了!怪不得余承东在IFA发布会上直呼友商是PPT新品了。

第二家是联发科,联发科在今年5月底宣布送样旗下首款集成5G基带的SoC,它采用7nm工艺,CPU大核同样是Cortex -A77,GPU是Mali G77,号称5G下行最快速度达到4.7Gbps!这款基带支持 6GHz 以下的 5G NR 频谱、高达 2x 的载波聚合、以及独立 / 非独立的 5G 网络架构。

奇怪的仍是两点:

1、其下载速度也是远远超过了5G的理论极限,是如何实现的?

2、该公司未披露确切的 SoC 命名和详细规格。

同样这颗芯片要到2020年Q1量产,采用该芯片的手机则要到2020年下半年面市了!

6

就以上问题我在发布会上问过华为院士艾伟先生,他说华为也不知道这个数值如何得来,并表示运营商都很疑惑这个数值他也请我向两家厂商求证。

所以综上所述,我认为麒麟990是全球目前唯一一款采用7nm EUV工艺量产的SoC芯片!唯一一款通信指标达到5G标准的手机平台,没有之一。

7

另外,麒麟990率先支持5G双卡,一卡5G上网的同时,另一卡可接听VoLTE高清语音通话,实现业界最佳5G双卡体验。此外,麒麟990 5G实现业界最佳5G能效,相比传统的4G SoC+5G Modem的解决方案,功耗表现优20%,带来更长效持久的5G体验。

此外,麒麟990还针对5G的特点做了大量优化,5G商用初期,由于网络覆盖不完善,5G还面临着弱信号场景联接不稳定、功耗较高、高速移动场景联接体验不佳等挑战,影响用户的上网体验。基于在5G领域的技术积累,麒麟990 5G全面升级5G通信实力。在5G信号较弱的场景下,麒麟990 5G推出智能上行分流设计,在视频直播、短视频上传等应用场景同时使用5G和4G网络,上传速率提升5.8倍,优化5G上行体验;

81

5G功耗挑战很大,为解决5G带来的功耗问题,麒麟990 5G率先支持BWP(Bandwidth Part)技术,在5G大带宽条件下实现带宽资源的灵活切换,与业界主流旗舰芯片相比,5G功耗表现优化44%,带来更长效的5G体验;面向高速移动场景,麒麟990 5G支持基于机器学习的自适应接收机,实现更精准的信道测量,下行速率提升19%,实现稳定的5G联接。

麒麟990也是业界首个5G全网通SoC,持续引领5G行业发展方向,除了提供增强的个人移动体验之外,5G还肩负着改变社会的重要使命,驱动移动通信与各行各业相结合,构建万物互联的智能世界。

5G时代,组网方式有SA(独立组网)和NSA(非独立组网)两种选择,但NSA只实现了超高带宽,只有SA才能更好地实现低时延和海量连接。而低时延和海量连接,正是整个行业实现数字化、智能化的必然需求。近日,工信部也表示自2020年1月1日起,申请入网的5G终端需要同时支持独立组网和非独立组网(SA和NSA)。综合来看,NSA是5G初期的过渡方案,成熟的5G解决方案必须具备同时支持SA和NSA的能力。

1

华为院士艾伟

据介绍,华为从2009年起开始致力于5G的研究和开发,经过多年努力,已经具备从5G核心网到基站,到5G手机、5G CPE和5G Modem都同时支持SA和NSA的端到端解决方案。此次发布的麒麟990 5G也是业界首个全网通5G SoC,率先同步支持SA/NSA 5G双模组网,全面推进5G产业发展,引领5G技术方向;率先支持TDD/FDD全频段,适用于所有5G网络频段需求,助力运营商更快部署5G网络,尽早为消费者带来更成熟的5G体验。

3、GPU领先,16核GPU打造极致游戏体

在CPU方面,麒麟990 5G仍然采用了类似麒麟980的大中小核架构--2个大核(基于Cortex-A76开发)+2个中核(基于Cortex-A76开发)+4个小核(Cortex-A55)的三档能效架构,最高主频可达2.86GHz,与业界主流旗舰芯片相比,单核性能高10%,多核性能高9%。能效方面针对不同大小的核精细调校,大核能效优12%,中核能效优35%,小核能效优15%,带来更快的手机应用打开速度,日常使用体验更加流畅。 

1

GPU方面,余承东表示麒麟芯片始终追求更好的用户体验。针对GPU在运行重载游戏、播放高清视频等高负载场景下容易出现的发热、掉帧、卡顿等问题,麒麟990 5G搭载16核Mali-G76 GPU,与业界主流旗舰芯片相比,图形处理性能高6%,能效优20%,实现业界领先的性能与能效。

2

艾伟表示华为考虑的更多是如何从系统层面优化和升级用户体验,所以华为通过全新系统级Smart Cache分流,支持智能分配DDR数据,在重载游戏等大带宽场景下带宽较上一代最高可节省15%,功耗可降低12%,进一步提升GPU能效。       

3

另外,针对游戏场景,麒麟990 5G推出Kirin Gaming+ 2.0,基于性能、能效强大的CPU、GPU与DDR芯片,Kirin Gaming+ 2.0推出高性能、高能效、高画质游戏解决方案,实现业界顶级游戏体验。

Kirin Gaming+ 2.0的核心技术是全新升级的AI调频调度技术,在CPU、DDR系统调频调度中全新引入GPU融合调度,并加入游戏关联线程优化技术,动态感知性能瓶颈。不仅如此,Kirin Gaming+通过对100万帧以上的游戏画面大数据进行学习,建立了精准的Kirin Gaming+游戏性能功耗模型,将性能功耗调度细化到游戏每一帧画面中,游戏帧率稳定60帧,每帧负载调频准确性提升30%。同时,麒麟990 5G支持HDR 10特效,游戏画质更高清,游戏体验更加真实沉浸。

这里有笔者拍摄的现场演示视频可以感受到麒麟990强大的游戏能力

有网友惊呼,“应该跟索尼合作移植PS游戏到手机上来,体验太爽!”

4、AI领先业界,达芬奇架构显神威

在端侧AI的发展历程中,麒麟芯片始终引领着产业方向。2017年,麒麟970在业内首次采用独立NPU神经网络处理单元,开创端侧人工智能的行业先河。2018年,麒麟980搭载双核NPU实现领先的AI算力,带来AI人像留色、卡路里识别等一系列创新AI体验。2019年,全新高端系列麒麟810更是首次采用华为自研达芬奇架构NPU,打破端侧AI性能纪录。麒麟990又带来什么?

1

它就是NPU大核+NPU微核创新设计架构--麒麟990 5G是首款采用华为自研达芬奇架构NPU的旗舰级芯片,创新设计NPU双大核+NPU微核计算架构,NPU大核展现卓越性能与能效,微核NPU实现超低功耗。

事实胜于雄辩,让人震惊的是麒麟990的算力提升!相比麒麟980,采用华为自研达芬奇架构的麒麟990算力提升高达476%!等于提升了近5倍算力!

可以预计,在AI+5G的全新赛道,麒麟990 5G将再度引领AI潮流。在双大核NPU(Ascend Lite*2)加持下,麒麟990 5G实现业界最强AI算力,与业界其他旗舰AI芯片相比,性能优势高达6倍,能效优势高达8倍,持续刷新端侧AI的算力高点。无论是在业界典型的中载神经网络模型ResNet50(用于检测、分割和识别),还是在移动端更流行的轻载神经网络模型MobilenetV1(用于分类、检测、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均达到业界最佳水平。业界首发NPU微核(Ascend Tiny)赋能超低功耗应用,在人脸识别的应用场景下,NPU微核比大核能效最高可提升24倍,让AI运算更省电。

56

余承东解释说,这好比一条高速路上让打车拉大货物小车拉小货物,配比更了合理道路使用更高效。

7

而基于麒麟990 5G的AI强劲算力,过去很多受限于功耗和算力的应用都将成为可能。麒麟990 5G使能AI多人实时换背景,通过先进的AI多实例分割技术,能够将视频画面中的每一个人物主体单独识别出来,实现多人物视频拍摄替换背景,甚至可以选择画面中需要保留的人物,让视频应用充满更多想象。AI视频超分能够基于麒麟990 5G的AI智慧,还原老旧设备拍摄的视频画质,画面瞬间达到高清质感。未来,麒麟990 5G强大的AI算力和丰富的开放能力,将进一步赋能AI应用,结合5G高速率、低时延、广联接的特征,探索更多智慧应用。

8

这是现场拍摄的实时视频背景变换

为何麒麟990  AI性能如此强大?这是因为它采用了华为独立开发的达芬奇架构。

在2018年华为HC大会上,华为轮值董事长徐直军发布了华为全栈全场景AI解决方案,首次公布了华为自研的达芬奇架构,并宣布基于达芬奇架构的系列化AI芯片:Max,Mini,Lite,Tiny和Nano五个系列。这五个系列可以理解为超大号、大号、中号、小号、超小号,它们能满足全应用场景的AI计算需求。

1

达芬奇架构是华为自研的面向AI计算特征的全新计算架构,具备高算力、高能效、灵活可裁剪的特性,是实现万物智能的重要基础。华为Fellow艾伟解释说达芬奇架构采用的是3D Cube架构,它是一种三维的架构,可以针对矩阵运算做加速,大幅提升单位功耗下的AI算力,每个AI Core可以在一个时钟周期内实现4096个MAC操作,相比传统的CPU和GPU实现数量级的提升。         

艾伟解释说达芬奇架构内部还细分成很多单元,包括核心的3D Cube、Vector向量计算单元、Scalar标量计算单元等,它们各自负责不同的运算任务实现并行化计算模型,共同保障AI计算的高效处理。同时,为了提升AI计算的完备性和不同场景的计算效率,达芬奇架构还集成了向量、标量、硬件加速器等多种计算单元。同时支持多种精度计算,支撑训练和推理两种场景的数据精度要求,实现AI的全场景需求覆盖。

1

其中,AI计算的核心是矩阵乘法运算,计算时由左矩阵的一行和右矩阵的一列相乘,每个元素相乘之后的和输出到结果矩阵。在此计算过程中,标量(Scalar)、向量(Vector)、矩阵(Matrix)算力密度依次增加,对硬件的AI运算能力不断提出更高要求。典型的神经网络模型计算量都非常大,这其中99%的计算都需要用到矩阵乘,也就是说,如果提高矩阵乘的运算效率,就能最大程度上提升AI算力——这也是达芬奇架构设计的核心:以最小的计算代价增加矩阵乘的算力,实现更高的AI能效。

华为创新设计的达芬奇架构将大幅提升算力,16*16*16的3D Cube能够显著提升数据利用率,缩短运算周期,实现更快更强的AI运算。举例来说,同样是完成4096次运算,2D结构需要64行*64列才能计算,3D Cube只需要16*16*16的结构就能算出。其中,64*64结构带来的问题是:运算周期长、时延高、利用率低。  

采用达芬奇架构的麒麟810h是达芬奇在端侧领域的尝试,小试牛刀NPU性能就超越了友商同类产品,麒麟810在单位面积上实现最佳能效,FP16精度和INT8量化精度业界领先,搭载这款SoC芯片的华为Nova 5、Nova 5i Pro及荣耀9X手机已上市,为广大消费者提供多种精彩的AI应用体验。

而采用达芬奇架构的超大号NPU昇腾910则性能爆棚,半精度(FP16)算力达到256 Tera-FLOPS,整数精度(INT8)算力达到512 Tera-OPS!成为算力最强AI处理器,它在训练领域大显身手。

下面视频介绍了达芬奇架构的原理

5、ISP再次创新,影像领先业界

自从麒麟950搭载华为自己研发的ISP后,华为不断在ISP上进行创新,这次麒麟990采用的是全新ISP 5.0,吞吐率提升15%,能效提升15%,全面优化视频处理能力,并把单方相机的降噪技术应用到手机端。 

1

在夜晚、光线较弱的暗光环境下,视频拍摄出现的噪点非常影响成像质量。从噪声类型来说,视频拍摄中出现的主要是时域噪声和空域噪声。其中,时域噪声是前后帧画面播放随时间变化产生的噪声,空域降噪是每一帧视频画面原本存在的固有噪声。业界在视频降噪方面大多采用单一的时域降噪,主要消除时间维度带来的噪声。

此次,麒麟990 5G全球首发双域联合视频降噪技术,针对视频中的高频、中频、低频噪声混合的场景,增加频域降噪过程,重点针对噪声进行精准分离处理,视频降噪能力提升20%,暗光环境下拍摄的视频更加清晰。首次在手机芯片上实现基于AI分割的实时视频后处理渲染技术,对每一帧视频画面色彩精心调色,让手机视频也能拥有电影调色质感。

2

同时,手机在暗光场景下的拍照能力也始终是用户关注的焦点。麒麟990 5G首次在手 机芯片上实现BM3D(Block-Matching and 3D filtering)单反级硬件降噪技术,首次将单反级的图像处理能力应用在手机上,照片降噪能力提升30%,暗光场景噪点更少,让手机大片越夜越美丽。

基于ISP的能力升级,麒麟990 5G支持全新炫酷Face AR。通过从摄像头捕获的人脸图像数据和基于NPU运行的神经网络算法,Face AR能够对人脸进行建模、实时跟踪、表情捕获,并且可以进一步分析出人脸信息背后的诸如心率、呼吸率等健康数据,提供围绕人脸的丰富的AR增强现实体验,探索AR应用的更多可能。

麒麟990有一个演示非常酷,就是用前置摄像头测试人的心率,它的原理是当用户的心脏跳动时,会有更多的血液流过用户脸部,绿光的吸收量也会越大。在心脏跳动间隙,血液流量减少,导致绿光的吸收也会减少。通过复杂精密的算法将心率信号有效监测并提取出来。利用CMOS传感器可以计算出血液中透光率的脉动变化,折算成电信号,对应就是心率。

拍照的同时还能测心率,酷吧,如果把这应用用到《非常勿扰》相亲节目上,不是很有趣?可以知道女嘉宾哪个男嘉宾真正心动?

3

6、AI生态领先,开放带来无限可能

华为创始人任正非经常提出熵减概念,就是要通过开放耗散企业的熵值,在人工智能领域,华为通过HiAI生态保持领先,这次华为也带来 HiAI2.0持续赋能AI应用开发,探索AI+5G无限可能。

随着AI+5G时代的到来,轻量化、免安装、跨平台和更多的交互体验将成为未来应用的发展趋势,这也要求手机芯片具备5G芯端云一体化的AI能力,以及大数据、平台化等更多创新技术集群。基于华为推出的全新达芬奇架构NPU和HiAI Foundation芯片能力开放,麒麟平台将持续为开发者提供更强大的端侧算力,充分激发端侧AI的运算潜能。

4

艾伟表示此次,麒麟990 5G也将为HiAI 2.0开放平台注入新的能量,助力开放能力进一步升级——支持300+算子,业界最多;提供完备的IDE工具,Android Studio插件,支持代码自动生成,提高开发效率;提供达芬奇架构IR开放,支持业界主流框架对接,实现更加完备的兼容性,让算法开发者保持原有的开发习惯,在HiAI平台上自动获取加速能力,为开发者提供更强大的工具链,探索AI+5G应用的无限可能。

作为5G和AI时代的引领者,华为将充分发挥麒麟平台的创新技术优势,面向开发者全面开放芯片能力,让更多开发者加入到全场景、智慧化的新应用的开发队列中来,共同促进应用产业的繁荣发展。

5

此外,与麒麟990 5G一起亮相的麒麟990,同样在性能、能效、AI及拍照方面实现重磅升级,为现阶段更广泛的4G手机用户提供更卓越的使用体验。

11

艾伟表示5G时代本土力量首次领先,基于中国完整的5G体系,可以创新出 很多新的商业模式和应用,如同4G激发了抖音、快手等短视频应用一样,5G必然会催生新一波机遇,重构生态和商业,我想这才是麒麟990领先带来的真正意义!

有了麒麟990的加持,华为年度旗舰机Mate30毫无无疑问将成为年度安卓机皇!9月19日将揭晓,我们拭目以待!

注:本文为原创文章,转载请注明作者及来源

相关文章

Digi-Key