透过Mate40 RS保时捷设计剖析麒麟9000:华为最强芯一骑绝尘
一、前言:海思十年风雨回首 麒麟9000一骑绝尘
不知不觉当中,海思手机芯片的故事,我们已经讲了有十年了。
2009年,蹒跚学步的海思K3V1诞生,它是华为试水手机AP芯片的一小步,虽然未得到华为自家的手机终端搭载,但所谓万事开头难,仍极具意义。
接着是青涩的K3V2,华为手机搭载的第一款自研芯片,它随华为Ascend P6/D2一同到来,在彼时以拥有前沿的64bit双通道内存带宽和作为当时“世界面积最小的四核芯片”而闻名。由于受到兼容性、功耗和发热表现等制约,K3V2并不算成功,但为后续手机芯片研发积累了宝贵的经验。
两次受挫未改变华为坚持自主芯片设计的既定路线。
2013年海思手机芯托名“麒麟”涅槃新生,作为第一枪的麒麟910吸取过往教训,换装Arm Mali的GPU,内存带宽收窄至32bit单通道,自研基带Balong 710首次与CPU、GPU集于SoC,加之28nm工艺解决过往顽疾,正式开启历史转折。
踩在麒麟920肩膀上的麒麟925助力Ascend Mate 7让华为手机第一次真正站上高端,尤其是自研Balong 720基带开始展现华为通讯领域的技术势能,当时能够支持峰值300Mbps的LTE Cat.6蔚为可观。
2015年的麒麟930和麒麟935让业界意识到了自研芯片的优势所在,这两个SoC帮助华为手机成功避开同期安卓阵营所深陷的骁龙810困局。
海思手机芯到了麒麟950这代终于“成年”,它是业界首款16nm FinFET 的旗舰SoC,凭借Cortex-A72与Cortex-A53的4 4大小核、Mali T880MP4GPU的强劲性能结合16nm FinFET 赋予的能效,正式进入全球手机芯片第一阵营,值得注意的是,此作的”PrimISP”成为华为发力手机影像的伏笔。
而后的麒麟960继续高歌猛进,至2017年的麒麟970突然另辟赛道,先于业界其它对手在手机SoC中引入NPU,并服务于为解决GPU图形计算效率问题而生的GPU Turbo,在游戏中实现功耗降低与性能提升。
2018年麒麟980臻于完美,集齐7nm工艺、2*A76大核心 2*A76中核心 4*A55小核心,以及作为GPU的Mali G76 MP10,综合各方面同期最接近苹果的A系列,达成完整旗舰形态。
2019年的麒麟990系列踩着5G风口完成了从与对手并驾齐驱、胶着厮杀到开始领先的本质飞跃,堪称划时代的一记重拳,全球范围内首次超前实现集成5G基带,自研的达芬奇架构NPU首次亮相。
到了2020年,前不久随华为Mate 40系列手机一起到来的,是最新的麒麟9000 芯片——这颗芯片被许多媒体、行业人士冠以“绝版”“绝唱”甚至是“最后一颗子弹”的名号。无论以上词汇是否言过其实,就当前的大环境来看,麒麟9000的确非常特殊。
今年8月份,余承东在中国信息化百人会2020年峰会曾公开说过,其芯片到9月15号生产就停止了,所以Mate40系列所搭载的麒麟高端芯片数量相对会比较有限。
值得一提的是,此前麒麟高端芯片几乎都被归纳在“麒麟900”系列,按照此前预期,接棒麒麟990的应该是“麒麟1000”,而现实是直接从“麒麟900”跨越到“麒麟9000”,这样终极的命名显现的似乎是一种放手一搏的决绝。
困局之中,麒麟9000就此诞生,成为全球首款量产商用的5nm集成式5G旗舰SoC,相比较同为5nm、外挂基带的苹果A14在体积、性能、散热等方面都更占优势,对技术挑战的解决完成度更高,在整个移动SoC领域都具有相当的领先优势。
接下来,我们就通过华为最顶级的旗舰机皇Mate40 RS保时捷设计,来体验一下麒麟9000的各种能力。
二、外观欣赏:感受顶奢机皇的华丽风采
Mate40 RS保时捷设计外包装
附带充电器、有线耳机、卡针等诸多配件
和Mate40 Pro一样,华为Mate40 RS保时捷设计同样是一部采用6.76英寸的88°曲面率大屏手机。双挖孔设计,只是UI方面继续了保时捷系列的红黑配色主题,相当深邃典雅。
不同于Mate40系列的其它机型,华为Mate40 RS保时捷设计的陶瓷机身背部走的仍然还是奢侈路线,它具备标志性的跑道元素,镭射而出的“PORSCHE DESIGN”与哑光陶瓷和两面陶瓷排布有序、凹凸有致。
机身的背部采用了独占的星钻摄像头设计,5个摄像头外加一个闪光灯,形成了一个八边形。八边形的中间区域是徕卡认证标识。能够将华为 保时捷 徕卡的三重logo同时置于一面的机型,也就只有历代保时捷设计了,最大限度凸显出用户身份。
预置的手机壳采用皮质,质地、手感与前代保时捷设计的机身后背相似。这样来看是为不同喜好的用户提供了两个选择——喜欢陶瓷手感可以裸机使用,喜欢皮质手感可以戴上原装手机壳,握感、品质与前代保时捷设计相一致。
标志性红色电源键
机身顶部
机身底部
66W充电器
三、麒麟9000性能及能效测试:GPU拉满24核心!大翻身
——麒麟9000规格一览
麒麟9000系列SoC的一大创举便是集成153亿个晶体管,苹果最新的A14也只不过集成118亿晶体管。晶体管的多少,直接影响芯片性能发挥。一般一个芯片上集成的晶体管越多,即电流在一个时间单位上流动的分支越多,那么该芯片的功能越复杂,性能也就越高,同一时间内处理的数据也就越多。
麒麟9000规格一览
——CPU
麒麟9000的CPU部分采用的是1 3 4的组合方式,其中的那颗Cortex-A77超大核心的3.13GHz主频,甚至比被奉为骁龙865超频版的骁龙865 Plus的3.1GHz主频还要更高一些,从这一点来看,CPU部分算是有着在过去难以想象的激进。
值得提的是,麒麟9000上协助CPU工作的存储子系统有了相当大的升级,这是从麒麟980时代就开辟的一大侧重方向。
华为海思早在麒麟980时期就给它用上了DSU 4MB L3缓存;麒麟990在前者基础上采用新的系统级别的缓存,同时降低存储子系统的延迟,该芯在当时的性能表现比麒麟980有所提升且功耗更低的原因除了先进制程加持,与华为海思在存储子系统的投入是分不开的。
到了麒麟9000这一代,按照华为Fellow艾伟对Smart Cache 2.0关于“相对直接访问内存来说,带宽提升了一倍”的表述,系统级别的缓存很有可能是提升到了8MB,也就是相比较上代容量翻番,对于性能、能效的提升有着相当大的助力。
多说无益,接下来让我们跑个分。
注意Mate40系列手机提供有性能模式,开启后可以让麒麟9000一直处于满血状态释放自己的能力,在跑分过程当中笔者将一直开启性能模式。
GeekBench考察的是CPU单核心、多核心性能,权威性毋庸置疑。华为Mate40 RS保时捷设计凭借麒麟9000的智能多核心调度,在性能模式下可以达到单核跑分1012和多核跑分3713的成绩,多线程性能有明显改进。
GeekBench单核心对比
GeekBench多核心对比
按照Geekbench5的衡量标准,麒麟9000单核性能大概比骁龙865 Plus提升3.1%,多核性能比骁龙865 Plus提升13%。值得一提的是,二者都是基于ARM A77架构,可以看出麒麟对于此代架构的设计与优化已经得心应手,无论是体现绝对性能的单核心,还是考验调度配合的多核心都达到了极高水准。
对比有代际差异的麒麟990 5G,麒麟9000的提升幅度更是明显,单核性能提升达29%,多核性能提升15%。5nm工艺带来的红利以及ARM A77架构的优势尽显。
——GPU
无论是苹果A系列还是安卓阵营的GPU,前些时间都开始呈现小碎步式的前进。
天赋Adreno的图形能力“带头大哥”高通没有大步快跑的跃进,本该趁着Mali G77大爆发时迎头追上高通的三星Exynos 990与联发科天玑1000都不约而同地采取了保守策略,前者使用Mali G77 MP11(11个核心),后者更甚使用规模更小的Mali G77 MP9(9个核心),而麒麟990 5G因为时间差或者是其它原因,使用的是Mali G76,算是错失良机。
终于轮到麒麟9000上场了,它一出手就意外地跳过G77,直接用上了Mali G78。Mali G78 GPU算是Mali G77的升级版,两者都采用Valhall图形架构,最突出的是首次支持到24个核心,相比Mali-G77的设计上限16个核心增加了有一半。
而且不同于猎户座或者联发科只能将G76的核心数拉至9到11个,麒麟9000拉满到Mali G78的设计上限,即24核,一改过去GPU方面高频少核的保守行进路线,大有放手一搏的意味。
GFXBench考量的是GPU图形核心游戏性能,可以看到麒麟9000相较于高通骁龙865 Plus甚至是苹果A13都已经难得的显露了领先势头,拉满24核心的Mali G78在此功不可没。
|
阿兹特克废墟(Normal) OpenGL
按照GFXBench的衡量标准,在阿兹特克废墟(Normal) OpenGL的测试项目当中,麒麟9000相比较骁龙865 Plus的领先幅度达50%,相当夸张。
阿兹特克废墟(Normal) Vulkan
在阿兹特克废墟(Normal)Vulkan的测试项目当中,麒麟9000相比较A13的领先达12%,相比较骁龙865 Plus的领先幅度更是达到了38%。
赛车追逐
在赛车追逐的测试项目当中,只有A13能够追上麒麟9000,而麒麟9000相比较骁龙865 Plus的提升幅度仍然比较大,达到了20%。
曼哈顿3.1
在曼哈顿3.1测试项目当中,麒麟9000相比较A13的领先幅度达17%,相比较骁龙865 Plus的领先幅度达到了27%。
曼哈顿
终于到曼哈顿测试项目,A13取得了不大的优势,此项当中麒麟9000相比较骁龙865 Plus的领先幅度达到26%。
霸王龙
霸王龙测试项目当中,麒麟9000相比较A13还有着19%的差距,但是相比较骁龙865 Plus仍能保持4%的领先优势。
综合以上测试数据来看,麒麟9000能够实现对骁龙865 Plus的全面压制,以及从26%到50%不等的测试子项领先。
即便是面对苹果A13,两者只存在不到20%的互有胜负。从GFXbench的测试结果来看,可以肯定麒麟9000的图形处理能力已经不逊苹果A13,考虑到A14(我们在撰写此文时未拿到iphone12系列机器,无法获得详细数据)相比较A13提升不大,麒麟9000的图形性能与之硬碰硬也有相当的可能。
——能效测试
所谓“开源”、“节流”。
在电池技术难以取得根本性突破的大背景下,延长手机续航只能从“节流”方面入手,以缓解续航焦虑。
由此,当前最先进的5纳米工艺制程成为了Mate40系列的节能必选项。
前文我们所看到的1个超大核 3个大核 4个小核的三档能效架构,也是在为能效做充分考虑:用户轻度使用时主要依靠小核减少能量消耗,看视频或者多任务时,大核动身,玩大型游戏时火力全开,呈现出梯度运行的路线,以实现最佳能效。
图形显示方面,麒麟9000集成了迄今安卓阵营最为强劲的24核Mali-G78 GPU集群,还有着诸如GPU Turbo等均衡高性能、高能效、高画质的解决方案加成。
不仅如此,麒麟9000还将巴龙5G基带集成在SoC内部,规避外挂处理所带来的额外能量消耗。
我们清空除监测软件之外的手机后台,将两部手机的屏幕亮度拉高到最大亮度,开启静音,调至FHD 分辨率,HDR 60FPS场景,然后用它们去观战同一场《和平精英》的游戏对局。
然后发现,搭载麒麟9000的华为Mate40系列旗舰与某骁龙865 Plus机型发挥出同样的性能表现的时候:
Mate40系列旗舰整机电流值记录为773mA,某骁龙865 Plus旗舰的整机电流值记录为890mA。
为了进一步了解芯片功耗情况,我们测试了两部手机的idle电流值,均在290mA左右。用整机电流值-idle电流值的计算方式,可以大致得出芯片的电流值: 麒麟9000电流值为483mA,骁龙865 电流值为600mA。意味着在我们的测试场景中,相同性能下,麒麟9000芯片的功耗可能要比865 优20%左右。
显然Mate40旗舰所搭载麒麟9000的能效要更高一些,所以综合性能与能效比等多个维度来看,麒麟9000如今的表现堪称突飞猛进。
四、影像体验:麒麟9000平台成就影像机皇
——Mate40 RS保时捷设计影像规格一览
华为Mate40 RS保时捷设计的背部是八边形星钻设计的超感知徕卡电影五摄,具体包括:
——5000万像素超感知主摄,1/1.28英寸传感器,光圈F1.9,支持OIS光学防抖;
——800万像素潜望式长焦镜头,支持10x光学变焦、20x混合变焦、100x双目变焦,光圈F4.4;
——1200万像素长焦镜头,支持3x光学变焦、OIS光学防抖,光圈F2.4;
——2000万像素电影镜头,超广角,光圈F1.8,1/1.53英寸,比IMX586和IMX708这两款顶尖超广角镜头还要大;
——3D深感摄像头,支持渐进式景深。
值得一提的是,这五摄还支持XD Fusion硬件实时HDR视频、AIS超级运动防抖等功能。前置则是双摄,包括1300万像素超感知镜头(广角 F2.4)、3D深感镜头,支持3D人脸识别、4K分辨率录像。
笔者在初上手Mate40 RS保时捷设计之时,首先被该系列强大的影像系统硬件所吸引,关注重点自然也一直停留在此。而随着体验的深入,我们渐渐发现,硬件之外的ISP、NPU与算法机制是华为Mate40系列的影像能力迥异于过去的灵魂核心,也是关键所在。
现今,随着定制传感器、重金堆料的泛滥,大多数厂商又重回同质化宿命。在这种情况下,算法、以及驱动算法的处理器平台的地位越来越重要。随着P40系列伴生的XD Fusion、华为Mate40系列伴生的麒麟9000平台到来,华为的影像体系进化到新高度。
——麒麟9000为强悍影像带来了什么?
华为早在Mate10手机上就引入当时业界首款移动AI处理器Kirin970的强大NPU,参与ISP图像处理流程。
到了这一代的华为Mate 40系列,麒麟9000 5G SoC芯片更是内置了目前华为最先进的ISP 6.0,带来50%的吞吐率提升,以及在噪声消除方面48%等提升,麒麟9000在业界首次实现了ISP NPU融合架构,带来超强的细节还原和降噪能力,可以被运用到手机摄影,尤其是暗光、弱光条件下的影像记录,助力Mate40系列再次夺得DXO影像排行榜第一名的霸主地位。
顺便提一下,大家现在熟知的类似IMX600、IMX700等图像传感器,实际不能独立获得色彩信息,它们都是“色盲”,需要色彩滤波器协助,否则拍出来的照片就是黑白的。
拜耳阵列RGB色彩滤波器
上图是比较典型的拜耳阵列RGB颜色滤波器。最下面一层灰色色块是一个个感光PD部分,光子在这里转换成电信号;上面一层R/G/B(红/绿/蓝)三种颜色的马赛克色块就是颜色滤波器,白光透过RGB色彩滤波器后,分别滤出红/绿/蓝光,在灰色PD部分被吸收。
华为从P30系列开始就将RYB色彩滤波器引入,凭借着覆盖更多光谱、捕获更多光子的特殊能力一直传延至今,进光量相比RGB色彩滤波器可以提升30%-40%左右,让Mate系列、P40系列的暗光拍摄能力一骑绝尘。
而且,这套方案至今没有其它任何一家手机厂商能够跟进。
如果探究此中因果的话,会发现有一项因素就是传统的手机处理器SoC中的ISP只能支持RGB算法,无法同时支持RGB传感器和RYB超感光传感器。ISP pipeline中各个模块无法应对Y像素所蕴含的颜色信息量,也无法对RYB传感器精准的插值。
正是凭借自研平台的优势,华为的技术演进路线是掌握自己手中的。基于以上复杂的需求,海思将全新的AI去马赛克算法、全新的AI色彩自动白平衡和全新的颜色管理算法一起整合进麒麟ISP Pipeline图像处理的框架当中。各模块的神经网络模型经过大量的RYYB sensor RAW数据训练后,能有效找到物体细节和色彩分量之间的映射关系,在传统ISP处理架构上用计算摄影的方法,实现RYYB的支持。
值得注意的是,ISP-NPU融合架构已经能将ISP处理流水线和NPU矩阵计算结合,解决了带宽问题,提升了神经网络算法的运行性能。麒麟9000的SoC内部甚至设计有硬件直连,将NPU计算直接融入ISP的Pipeline中,利用SmartCache 2.0的大容量、大带宽能力,形成硬件级的帧内和帧间信息直通,在一帧33ms时间内,多个算法无缝切换,首次实现端侧AI实时像素级视频处理。
简而言之,造就强大的影像系统,并不是单纯依靠纸面参数强大的图像传感器便能一蹴而就,色彩滤波器和ISP算法pipeline作为最终成像的物理和算法基础至关重要。
而且从华为的影像技术演进来看,要想在此领域构建起高壁垒,其中基于SoC平台发挥的算法基础可能才是关键的法门所在。
——样张展示
主摄微距
主摄 夜间拍摄
超广角逆光HDR
超广角 夜间拍摄
3X变焦夜间拍摄(添加怀旧滤镜)
3X变焦夜间拍摄雕塑
10X变焦拍摄
10X变焦 抓拍悬于风中、垂直地面的落叶
10X变焦微距
总的来看,麒麟9000芯片的ISP、NPU结合XD Fusion,对Mate40 RS保时捷设计全焦段的优化十分显著。特别是针对暗处细节的优化、复杂光线下的色彩纠正以及必要的HDR优化都相当出色。
五、总结:向上攀登的故事仍在继续
华为Mate40 RS保时捷设计为用户带来了相较以往更加高端商务的外观设计,更优秀的屏幕观感和握持体验。不止于外观,该机无论是在影像、还是其它体验的表现,都足以撑起华为顶级奢侈旗舰的地位。
这背后,是与之相配的麒麟9000为其高筑起平台基底。
而且,关于麒麟芯片目前所遭遇的来自外部环境的困难,相信大家都有所耳闻。在这样的困局之下,麒麟9000却依然能够在技术上超越以往5G芯片的精密与强大,以一个非常高的完成度出现在消费者面前,帮助夯实Mate系列5G旗舰性能巅峰的行业地位,难能可贵。
通过测试体验,我们发现:
首先是CPU部分,得益于5nm制程红利以及海思团队的核心调配优化能力,麒麟9000相比较同为A77架构的骁龙865 Plus,在Geekbench评判体系当中单核性能比之提升3.1%,多核性能比之提升13%,达到了极高水准。
GPU曾经是海思平台的一块短板,也正是因此倒逼华为推出GPU Turbo等各种软件方案强化图形处理能力。而今短板不再,反而成为麒麟9000的一大亮点所在,华为史无前例地将GPU的核心数堆到设计上限,所有人第一次看到24核心的GPU在麒麟平台满血释放,蔚为壮观。
超大规模的GPU带来了性能和能效的巨大提升。在我们的GFXbench测试当中,阿兹特克废墟(Normal) OpenGL的测试子项,麒麟9000相比较骁龙865 Plus的领先幅度达到了50%!即便是面对苹果A13,两者综合起来只存在不到20%的互有胜负。
从GFXbench的测试结果来看,可以肯定麒麟9000的图形处理能力已经不逊苹果A13,可以想象打着时间差在明年上场的骁龙875压力会陡升得多么大。
综合5nm制程工艺、CPU三挡能效架构以及集成式5G基带设计等,能效方面,我们仅仅是打开一个手游进行简单测试,就能发现搭载麒麟9000的华为Mate40系列手机与某骁龙865 Plus机型在维持同一性能表现的前提下,显现了20%左右的效率提升,综合性能与能效比等多个维度来看,麒麟9000如今的表现堪称突飞猛进。
影像更无需多言,这是华为的基本盘,华为Mate40 RS保时捷设计能够集齐这世上仅有的超感知徕卡电影五摄,又有麒麟9000芯片强悍的ISP、NPU结合XD Fusion,对全焦段、暗处细节、复杂光线下的色彩纠正、必要的HDR优化十分显著,进一步巩固影像霸主的地位。
Mate40 RS保时捷设计作为年度顶奢旗舰、麒麟9000 5G SoC作为年度旗舰顶级芯片,确实都做到了不负众望。而且它们是在重重困境之中,遭外力束手束脚之后,仍能交出如此完美答卷,一如前言回首的十年逆风之旅,华为、海思向上攀登的故事仍在继续。