骁龙Adreno GPU的劲敌!ARM Mali-G78到底有多强?
更新时间:2020-11-24 10:50:29 浏览次数:682+次在Android手机的GPU领域,现在正处于高通Adreno和ARM的亲儿子Mali两强争霸的格局,昔日知名的GPU品牌PowerVR已被淡出了历史。
从麒麟9000开始,越来越多的新款SoC都开始陆续列装ARM最新的Mali-G78。这颗GPU有啥特色,它打得过最新的Adreno GPU吗?
变与不变的架构
在ARM今年发布的新架构IP中,除了Cortex-X1以外,Cortex-A78和Mali-G78都有些偷懒的嫌疑。
前者沿用了Cortex-A77的Austin微架构(基于ARM v8.2指令集),后者也延续了Mali-G77的Valhall图形架构。
好消息是,Mali-G78在Mali-G77的微架构层面进行了些许优化,比如将全局时钟域改为全新的两级结构,实现了上层共享GPU模块与实际着色器核心频率的分离,也就是异步时钟域。
这样一来,GPU的核心可以工作在与其他部分不同的频率上,可快可慢,从而解决几何输出与计算、纹理、引擎之间的不平衡问题,还能让GPU运行在不同电压上,从而降低功耗、提高能效。这也是桌面级CPU、GPU通用的做法。
此外,Mali-G78还彻底重写了FMA(融合乘加)引擎,包括新的乘法架构、新的加法架构和FP32/FP16浮点,可以大幅节省功耗。
根据ARM的资料显示,得益于综合架构、工艺等各方面的改进,Mali-G78相比于Mali-G77的性能提升幅度可达25%,即便是在同等工艺条件下也可提升15%,同时能效提升10%,机器学习性能提升15%。
更多的计算核心
在Mali-G77时代,最多可以搭配16个计算单元,也就是Mali-G77 MC16,但受制于成本、发热和功耗,哪怕是最激进的Exynos 990也才用了11个计算单元,即Mali-G77 MC11,天玑1000+和天玑1000-L则分别配备了Mali-G77 MC9和Mali-G77 MC7。
这一次,Mali-G78?GPU最多则可以搭配24个计算单元,哪怕Mali-G78和Mali-G77采用了完全相同的架构,更多的计算单元也能堆出更强的理论性能。
首发麒麟9000
麒麟9000系列是第一颗已量产的,采用Mali-G78?GPU的SoC平台。其中,麒麟9000标准版集成的的Mali-G78MC24就是这颗GPU的“满血版”(指核心数量,不涉及核心频率),而麒麟9000E也集成了多达22个计算单元的Mali-G78MC22。
换句话说,麒麟9000系列集成的Mali-G78MC22或Mali-G78MC24,已然代表了这颗GPU的性能上限。从3DMark的基准测试成绩来看,Mali-G78MC24的表现没有让我们失望,哪怕是对比当前Android领域的最强音,骁龙865集成的Adreno 650也有着极大的优势,甚至有机会与骁龙875集成的Adreno 660掰一掰手腕。
除了麒麟9000,三星旗下的Exynos 1080和Exynos 2100也都会集成Mali-G78?GPU。其中,Exynos 1080受制于定位,只集成了10个计算核心的Mali-G78MC10,而Exynos 2100还未正式发布,预计它的核心数量规模会在16个~24个之间。
此外,联发科天玑2000也会选用Mali-G78?GPU,但核心数量规模同样未知,但应该不会小于16个。
总之,Mali-G78的性能较上代Mali-G77有了小幅提升,在最新5nm工艺的加持下可以进一步减小封装面积,降低功耗,或是塞进更多的计算核心。而计算核心数量和频率越高,Mali-G78的性能自然也就越强悍,只要能做到核心数量和频率的满血,打败未来的Adreno 660也并非不可能。