科技瞭望台:Arm v9会带来什么改变(arm v9提升多少性能)
在2011年,Arm发布了新一代Arm V8架构,在几年后的苹果iphone 5S上,苹果基于Arm v8架构所打造的A7 SOC凭借一系列的新特性还有全新的64位应用支持,在手机市场上取得了独特的优势,大杀四方。而在十年后的2021年,ARM 推出了全新一代的Arm V9架构,全新的Arm V9将会带来什么新特性的加入,对于ARM来说还会带来什么改变?本期科技瞭望台就让我们一起远望Arm V9所带来的改变。
01/Arm V9有何不同?
本次Arm 推出的Arm V9目标重点在三个部分:第一个是安全性方面的提升、第二个是更进一步的AI性能、第三个是整体性能速度的提升。
我们先来看第一个方面,在安全性部分上,Arm V9加入了包括内存标签(memory tagging)和域管理(Realm management) 在内的关键内容,进一步提供了内存方面的安全性,并且在有关安全性方面的数存放上,创建了更进一步的保险容器机制。除此之外,全都的Arm V9还引入了新的Arm保密计算架构(CCA),这一个Arm保密计算架构(CCA)通过基于硬件的安全环境保护敏感数据。可动态创建各种需要调用的域,在域中可对所得的代码进行使用,其余的内容无法被使用调配,以保护重要数据和代码不受影响。
而在AI性能和整体速度的提升上,Arm认为在未来几年中越来越多的ML工作负载(机器学习负载)将变得司空见惯。更多的AI会在各种领域进行更进一步的应用,而在AI性能提升的同时,也需要配备更进一步的性能。由此引入了全新的升级。
在Arm V9上,Arm引入了SVE2指令集(SVE 可伸缩向量扩展),SVE2指令集相比SVE的128位矢量,SVE2可以支持多倍128位运算,最多2048位,因此SVE2可以增强ML机器学习、DSP信号处理能力,提升了未来5G、虚拟现实、增强现实以及CPU本地运行ML的性能。通过SVE2指令集的加入,Arm V9能支持更进一步的矩阵卷积算法,且将SVE2指令集的部分性发挥在AI上,使得Arm V9在AI性能和其他应用上取得更好的表现。
Arm V9整体比起Arm V8来说,并没有从Arm V7向Arm V8之间的升级那么明显,虽然有诸如领域管理拓展、内存拓展等一系列的功能,但在其中最为大的差距就是全新的SVE2指令集的加入。所以外媒认为此次从V8升级到V9的ISA(指令集架构 Instruction Set Architecture),SVE2指令集是一个关键。
02/跟随Arm V9推出的硬件
在Arm V9推出的同时,采用Arm V9指令集架构的硬件也被同步推出。ARM 推出了Cortex X2、Cortex A710以及Cortex A510这三个公版的全新核心。
我们先看Arm推出的Cortex X2核心,这一个核心延续了Cortex X1目前的大核定位。在官方的PPT对比上,Cortex X2相比较于Arm自家推出的Cortex X1有了接近16%的IPC提升。但是如果我们仔细看可以发现,在AERM官方的对比上是8MB L3(三级缓存) 的Cortex X2去对比4MB L3的Cortex X1而得到的16% IPC提升,所以在实际的提升方面并不会高出很多。而在功耗方面,Arm官方展示在同一个工艺节点的情况下,Cortex X2核心所需的更好将比Cortex X1核心高出22%,在这种情况下,若如不对制程工艺进行升级,以现阶段的工艺对Cortex X2核心进行制造生产,必然又是功耗增大而导致一系列的翻车问题,对于不少的厂家来说有如噩梦一般。
然后是Arm推出的Cortex A710核心,在Cortex X系列核心推出前,Cortex A7XX系列是Arm系列中的大核心,在Cortex X推出后,Cortex A7XX系列核心在目前就是被定为中核的规格。
Cortex A710核心整体和此前推出的Cortex A78核心相比较,更像是一个全新的补丁修正提升版本。Cortex A710核心重点是对于分支预测计算性能的提升还有在分支预测缓存方面的缓存提升。并且Arm官方也宣称Cortex A710核心拥有更进一步的能耗比提升。
而从Arm官方的对比来看,Cortex A710(8MB L3)相比较Cortex A78(4MB L3)提升了接近10%的整体性能,在达到同样性能的情况下,功耗降低了30%。但是如果我们考虑到对比中的差异的话,那么实际的产品还有怎么样的表现,就需要打一个问号了。
最后是Arm推出的Cortex A510核心,在官方的定位中,其属于小核的分类中。在Cortex A510上,出现了有所不同的地方,Cortex A510采用的是两颗核心为一组的设计,两两一组之间共享L2缓存以及浮点性能。SVE2之类的支持等特性,这一点类似于AMD早年推出的推土机架构,也是采用了两两一组的共享L2之类的设计。而至于会带来什么样实际的提升和一系列的有关内容,还需要等待全新产品的出现。
除了CPU核心之外,Arm还对旗下的Mali系列GPU进行了更新,推出了G710、G610、G510、G310。其中的G710是G78后的直接继任者,定位于旗下的高端旗舰。而G610是定位比G710低一档的产品,是定位于高端的产品。G510则是接任G57定位于中端产品。G310是接替G31的入门级产品,将主要面向智能电视以及部分的场景需求。
03/展望未来
在现阶段,接入谷歌Play生态的APP已经是全部转为64位应用。但是在国内,由于各大应用数量的众多且分发平台较为分散,所以在现阶段还是存在不少的32位APP。Arm此次基于Arm V9推出的Cortex X2、Cortex A710以及Cortex A510中,Cortex X2以及Cortex A510只有对于AArch64的支持,也就是说只对64位应用进行支持。而根据Arm官方的说法的,为了部分地区的需求Cortex A710并非只对AArch64进行支持,而是对AArch32也进行了支持,也就是说其中的Cortex A710还能实现对32位应用的兼容。从Arm 一系列规范来看,国内的应用更要进一步的加速升级至64位应用,才能对核心性能进行更好的利用,而不是只是将性能负载放置在Cortex A710上。
Arm官方也宣布了对于未来的的展望,Arm预测未来十年合作伙伴基于ARM芯片的出货量将超过3000亿。Arm正致力于将Arm v9技术引入各个领域,以系统级设计最大程度地提高性能。借助移动生态系统的规模优势,在笔记本电脑、台式机、云等应用领域打造领先的解决方案。” Arm v9 还希望延伸到5G网络、数据中心、以及更多终端与车载架构计算。
对于国内的厂家来说,Arm 官方宣布,经过了一系列的技术审查,Arm v9架构不受美国出口管理条例(EAR)的约束。所以对于受到美国打压的企业来说,依然可以购买到Arm V9的授权,在这一个IP上进行一系列的后续开发。
此次Arm推出的产品还是属于初级阶段,后续Arm应该会对处理器和GPU之类的内容进行进一步的更新,以发挥更进一步的性能。