高通骁龙865AI性能成绩登顶,高达112309分
鲁大师新公布的2020年1-3月手机AI芯片排行榜上,高通最新旗舰移动平台高通骁龙865以112309分的成绩登顶,是排名第二的苹果A13处理器59050分的近两倍。苹果的A系列处理器诞生之初表现平平,经过多年迭代,最新的A13处理器十分强大,特别是AI性能。 这一次,骁龙865的AI跑分性能远超苹果A13,不仅证明了骁龙865搭载的高通第五代AI Engine强大的实力,也让我们对更多AI应用的落地充满期待。 鲁大师AI跑分是排名第二A13的近两倍!骁龙865的AI性能如何登顶? 鲁大师2020第一季度手机AI芯片排行 骁龙865 AI跑分强势登顶 2019年的手机和手机SoC发布会上,AI跑分似乎已经和CPU、GPU跑分一样重要。国内著名的跑分软件鲁大师也推出了AImark,并于2019年将AImark升级为2.0。 鲁大师AImark使用四种神经网络ResNet34、InceptionV3、MobileNet SSD、DeepLabv3+模型,对应图像分类、图像识别、图像分割测试,通过手机SoC的识别效率判断手机的AI性能。 不过,要获得高跑分不仅完成测试的速度要快,还要准确率够高。 鲁大师AI跑分是排名第二A13的近两倍!骁龙865的AI性能如何登顶? 鲁大师AImark评分标准 骁龙865在鲁大师第一季AI跑分中以近乎第二名两倍的跑分强势登顶,说明了骁龙865在鲁大师AIMark的评分体系下,准确率、性能、能效都是最优。这就值得我们进一步深挖高通实现强劲AI性能的关键。 高通第五代AI Engine如何炼成? 鲁大师AI跑分是排名第二A13的近两倍!骁龙865的AI性能如何登顶? 骁龙865的性能提升和功耗降低,图片来自vivo官网 骁龙865是高通2019年底发布的最新一代旗舰移动处理平台,集成的新一代Kryo 585 CPU较上一代性能提升达25%,全新的Adreno 650 GPU整体性能也较前代平台提升25%。特别值得关注的是,骁龙865搭载的高通第五代AI Engine,性能最高可达每秒15万亿次运算(15 TOPS),是上一代骁龙855 AI性能的2倍,相比骁龙845 AI性能更是提高了5倍。 鲁大师AI跑分是排名第二A13的近两倍!骁龙865的AI性能如何登顶? 手机处理器15 TOPS的性能在业界是什么水平?根据公开数据,业界去年底到今年初发布的最新5G手机SoC的AI性能在4.5TOPS到10TOPS之间。明确了骁龙865第五代AI Engine的15 TOPS AI性能在业界的地位之后,接下来的问题就是第五代AI Engine是如何在移动端实现这么高的AI性能? 对于依靠有限的电池供电的移动设备而言,找到性能和功耗的最佳平衡点才是最大的挑战。单纯从芯片设计的角度,要实现高性能低功耗专用电路是个好选择,但专用电路灵活性非常低,难以满足不断迭代和更新的AI算法需求。 因此,高通自第一代AI Engine就采用了异构设计的思路,用一系列的硬件和软件组成AI Engine,包括Kryo CPU、Adreno GPU、Hexagon处理器,更好地实现精度和功耗的最佳平衡。比如在适合标量处理器上运行的任务就调用Kryo CPU,深度神经网络的全连接层放在Adreno GPU上处理,而池化层、卷积层等就用Hexagon张量处理器处理。 在第五代AI Engine中,除了CPU和GPU性能提升带来的AI性能的提升,高通还改善了GPU的浮点运算性能,全新的张量加速器首次引入HTA实现了专用的可编程的AI加速,将TOPS性能提升了4倍。 这样的设计,让AI Engine可以用Adreno GPU加速16位和32位浮点运算,用Hexagon处理器负责加速8位和16位定点运算,保证灵活性的同时实现更好的效能。 而高能效的实现,Hexagon处理器成为关键。这是因为,业界刚开始应用AI技术的时候,为了解决问题,会用更复杂的网络和更高精度的数据(比如32位浮点数)训练网络,但这需要消耗大量计算资源和能耗。随着AI算法的迭代和研究的深入,业界用稀疏化、剪枝、量化、压缩等多种方法优化神经网络,让边缘和终端设备进行AI推理的时候,能够用更低精度的数据,而不损失网络精度。 这对于追求高能效的智能手机意义重大,谷歌的一份白皮书曾指出,利用8位定点运算有助于模型更快的运行,同时它的能耗也更低。在AI领域耕耘多年的高通显然也了解这一点,因此,骁龙865 AI Engine的核心Hexagon 698 DSP张量加速器,选择支持的是支持8位和16位的定点运算,达到了能效比35%的提升。 另外,为了解决AI计算数据搬运能耗是卷积计算能耗几十倍甚至上百倍的业界难题。高通还开发了专用的深度学习带宽压缩,这项技术能够对数据进行高达50%的无损压缩,在不损失精度的前提下,让芯片需要处理的数据减少一半,实现更低功耗。当然,如果是对AI性能要求极高的应用,骁龙865支持的LPDDR5内存可以带来30%的带宽提升实现很好地支持。 可以看到,第五代AI Engine异构设计带来的灵活性,Hexagon处理器对定点8位和16位数据类型的支持有助于提升效能,还有专有的深度学习带宽压缩技术,让第五代AI Engine能够支持高精度的同时保持高能效。 (编辑:52站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |