摩登3内部554258_华为也能用的Armv9,引发市场新的竞争力

Arm架构在如今的电子行业中可以说是无处不在。自1990年Arm公司正式成立Armv4架构到2011年Armv8架构,短短21年架构经过了5次重大升级。而Armv8意味着Arm正是从AArch32迈进AArch64,凭借强大的实力在过去的五年基于Arm架构的设备出货量超过了1000亿。

十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的则是日益强大的安全、人工智能(AI)和无处不在的专用处理的需求。实际上,Armv9架构的推出也与正预示着行业的发展方向。凭借新架构,Arm提出了3000亿的目标。

Armv9的三个技术特性

根据Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite的介绍,Armv9架构是基于Armv8既往成功的基础,并增添了针对矢量处理的DSP、机器学习ML、安全等这三个技术特性。

Armv8之所以“统治”市场十年之久,最大的升级点便是引入了64架构,即AArch64,这也是Arm版本升级最大的一次改变。除此之外,AArch64摒弃了此前的处理器模式、优先级级别等传统概念,提出了ELException level),并在兼容设计上定义了两套运行环境ESExecution state)。这些也都被Armv9所继承,可以说Armv9是集大成者,将Arm三十多年的核心完美继承下来。

矢量处理的DSP、机器学习ML处理能力提升要归功于可伸缩矢量扩展(SVE2)和矩阵乘法指令的引入。相比SVE128位矢量,SVE2可以支持多倍128位运算,最多2048位,因此才有如此魔力可以增强对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力。

根据Richard Grisenthwaite的介绍,SVE2增强多项DSP和机器学习ML处理能力,例如Scatter-Gather DMA直接存储器访问,把它放到CPU架构中,能实现更多的循环,更大的DSP处理能力,从而支持更多的并行化。

安全能力提升则主要是通过Arm推出的全新的机密计算架构CCAConfidential Compute Architecture)实现,根据介绍CCA通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。同时还将基于此前的TrustZone安全技术引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。

Armv9在算力上的提升

提到架构的升级,就离不开算力这一个话题,Armv9架构能够为Arm后两代产品提供30%的性能提升。根据介绍,以智能手机等移动平台使用的Cortex-X/A系列为例,X1/A78这一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架构及Makalu架构会保持30%以上的IPC性能提升。

除了CPU性能以外,Armv9还非常重视整体的性能提升,包括降低内存延迟(从150ns降至90ns)、频率提升(从2.6GHz到3.3GHz)内存带宽(从20GB/s到60GB/s)、缓存等。

Richard Grisenthwaite强调,Arm在新一代架构Armv9上将保持这个速度,预计未来两代移动和基础设施CPU的性能提升将超过30%。,这个数据是根据业界标准评测工具来衡量的,而且这样30%的算力提升完全是凭借于本身的架构而不是借助于制程工艺来实现。

另外,随着摩尔定律正在放缓,如何进一步提升算力呢?他认为,Arm将通过最大化地提升频率、带宽、缓存大小、并减少内存延迟,以最大化CPU性能。

除了CPUArm还表示Mali GPU会增加更多高级功能,例如VRS可变帧率渲染、RT光线追踪及其他高级渲染技术等。

Armv9引发的市场竞争力

实际上,在去年Arm发布Arm® Cortex®-M55处理器和Arm Ethos™-U55神经网络处理器(NPU)两款重磅“性能炸弹”时,就已开始蓄力发展人工智能(AI)。Cortex-M55是Arm历来AI能力最为强大的Cortex-M处理器,能够大幅提升DSP与ML的性能,同时更省电。

反观行业趋势,应用开始要求提供更高的数字信号处理(DSP)性能,实时算法的复杂程度增加和浮点算法趋势下,DSP核或硬件加速单元越来越多被部署内嵌在器件之中。DSP一直影响着下一代产品创新,这是因为许多算法在字长和动态范围有着很高的要求,DSP可免去定点到浮点的转化工作加速产品上市,另外DSP浮点计算成本越来越接近定点计算。正因如此,便形成了Arm+DSP内核的黄金搭档。

另外,行业也正在将越来越多的机器学习工作负载变得更加普遍,虽然机器学习有着许多专用的加速器,不过相比来说大量的小范围机器学习的主力仍然是CPU,因此矩阵乘法指令成为关键。

在安全性能上,Arm曾在此前进行了多维度的功能增强,包括PSA认证、TrustZone等。目前PSA认证已经有有超过35个合作伙伴提供的60多种认证产品,而新推出的CCA则也将基于TrustZone提供更加安全的架构。

Armv9着眼的点来看,行业正逐渐对算力功耗平衡性和安全性能要求提高。Arm架构可用在物联网的大部分设备之上,因此对这两项要求更加吃紧。大数据时代爆炸量的信息增长下,一方面将计算分成了多个维度,另一方面将会对数据安全提出更高的要求。

根据Arm的介绍,搭载ARMv9处理器的芯片最快在2021年年底就会面世,物联网发展日趋成熟,这个时间点恰好提升竞争力的好时机。市场或将拥有追求极致计算性能的高端产品、超低功耗的省电高手、主打安全可靠的产品。而Armv9经过架构的更新,能够从底层和非制程方向进行大改革,相信能为市场带来新的竞争力。

而在广为受关注的国内授权问题上,Arm强调:“Arm既有源于美国的IP,也有非源于美国的IP。经过全面的审查,Arm确定其Armv9架构不受美国出口管理条例(EAR)的约束。已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。