为主流价位移动设备加入AI计算:ARM发布新一代Mali解决方案

简介: 随着人工智能技术的逐渐实用化,人们对于机器学习算力的需求正在飞速增长,除英特尔、英伟达等传统芯片厂商以外,谷歌、亚马逊等公司都在致力于打造自己的专用 AI 处理器。

3 月 6 日下午,移动设备芯片设计公司 Arm 在北京举行了产品发布会,向全球发布了其人工智能计算的最新解决方案,其中包括 Mali-G52、G31 移动端显卡,Mali-D51 显示处理器以及 Mali-V52 视频处理器。


e928e246d911f4120bdc5c5669e2755a.jpg



随着人工智能技术的逐渐实用化,人们对于机器学习算力的需求正在飞速增长,除英特尔、英伟达等传统芯片厂商以外,谷歌、亚马逊等公司都在致力于打造自己的专用 AI 处理器。为了保持在移动芯片领域的领先地位,Arm 也在沿着自己的道路不断推进。2 月 14 日,该公司宣布启动 Trillium 项目,其中包括未来的专用机器学习处理器、目标检测处理器,以及神经网络软件库的 Arm IP 套件。而昨天在北京发布的新一代硬件产品则宣示了 Arm 在主流市场上已开始了自己的行动。


「目前在移动的世界里,消费者的使用行为已经发生了变化,」Arm 计算事业群市场营销资深总监 Ian Smythe 说道。「今天,手机是人通向世界的大门,Arm 作为一家企业的使命是让技术以无形的方式来让人连接世界。」


在 Arm 看来,今天移动端设备消费者行为的变化带来了三大新需求:机器学习应用、3D 视频游戏、和虚拟/增强现实。


这或许意味着未来芯片市场的格局会出现翻天覆地的变化。据估算,至 2018 年底,中国将设计和制造超过 10 亿台智能手机并销往世界,中国厂商在海外市场的份额正在以每年翻倍的速度快速增长。这样的速度使得 Arm 分外重视中国市场,该公司正在积极寻求与国内厂商在新架构上的合作。


目前,Arm 对于自己在市场上的领先地位感到满意。「目前市场上大部分移动技术都是基于 Arm 的,」Ian Smythe 介绍道,「其中包括 Cortex-A 的处理器——世界上绝大部分的智能手机都装载了 Cortex-A 系列处理器。同时 Arm 拥有一个多媒体方面的品牌 Mali,它也是全球 GPU 出货量最大的 GPU。简而言之,Arm 在全球的合作伙伴去年共计出货基于 Mali 的片上系统(SoC)达到了 12 亿片。」


e62abfb542b117f9fa5cbe73151d91c1.jpg


AI 和机器学习是现在最热门的话题,而作为被用到最多的计算设备,手机等移动设备则是机器学习的重要应用场景。很多用户已经在不知情的情况下享受到了机器学习带来的便利。事实上,在搜索、机器翻译和照相等应用的背后都有机器学习的身影。


作为最大的移动端芯片设计者,Arm 的产品是机器学习计算的重要承载设备。根据 IDC 统计,目前市场上 90% 的 AI 计算由 Arm 来实现的。


与华为、苹果推出的深度学习芯片相对应,Arm 在 2017 年推出了 DynamIQ 异构计算解决方案。DynamIQ 完全改变了 Cortex 系列处理器的部署方式,它为 CPU 引入了一系列全新指令集,极大提升了人工智能计算的性能。同时它也极大地提高了多核计算的灵活性,在 8 核处理器系统中(1 大核加 7 小核),DynamIQ 实现了在同样的硅面积之下,总体线程性能翻一番,与此同时,它也能实现高性能的双四核布局。


在发布会上,Arm 发布了全新的 Mali-G52、G31 移动端显卡,Mali-D51 显示处理器以及 Mali-V52 视频处理器设计。据介绍,新一代芯片设计在机器学习计算性能上有了大幅提升,适用于主流市场上的手机、智能电视等设备。


Mali G52 GPU 的上一代 G51 是正好在一年以前发布的,时隔一年,新一代的产品就已获得了性能密度 30% 的提升,性能效率比 15% 提升,而在机器学习能力上,新一代设计更是获得了 3.6 倍的性能提升。


62d053d31eb21c8541c0b85df9cc9cf0.jpg


Mali-G52 采用典型的四核布局。其执行引擎由 G51 中的四线程扩展到了八线程。因此在复杂的指令上,它能够实现两倍的性能,因此在芯片面积上 G52 是 G51 的 1.2 倍,但性能上前者却是后者的两倍。为了更好地支持机器学习,Arm 也加入了一些具体的指令,其中包含英特尔一直以来支持的一些指令,在 ImageNet 图像分类与 Yolo network 卷积层性能测试中,G52 的性能相对前代产品都有了非常大的提升。


87ec2ccc51f533f014091173be8460ae.jpg

在显示芯片上,Arm 配套推出了 Mali D51,它是去年 DP650 的继承者。相较前代产品性能密度提升了一倍,通过使用 Offload 技术,它的性能效率则有 30% 的提升,同时内存时延减少了 50%。


通过把 Mali-D51 和 Assertive Display5、HDR10 结合在一起。Arm 的解决方案可以让目前主流价位设备的显示屏都能实现 HDR4K 画质,从而进一步提升产品的竞争力。


0e05cf62c2e7657eab9e23e2bd2276ec.jpg

Mali-V52 则是基于 Arm 多核 Video 的视频输出解决方案。与前代产品 Mali-V61 相比较,其在解码性能方面有了一倍提升,硅晶片面积降低了近 40%,同时在视频的质量上提升了 20%。针对于一些特定的使用场景,Arm 能够提供优化解决方案。如在智能电视应用上,基于 Mali-V52 的设备可以在一个电视显示屏上同步展示多达 16 个视频流。


1743586cb335f39597a1f0108b02274b.jpg

与此同时,Arm 还推出了面向低端市场的新一代 GPU Mail-G31,它也是 G30 系列,Bifrost 架构家族中的第一款 GPU。它和 Mali-G51 采用的架构技术是一样的,但总硅面积降低了 20%,在性能密度上也有 20% 的提高,同时在 UI 性能方面有 12% 的提升。


95901ce3abc7af5454f2bbb4e70dc37b.jpg


至此,Arm 的下一代中/低端视频处理芯片解决方案的组件已全部推出,这家公司正在积极推进新设计的产品落地。Ian Smythe 表示,目前已经有很多合作伙伴正在开发基于 Mali V52、D51 的产品。在 GPU 方面,预计在今年晚些时候我们就将在市场上看到搭载 Mali G31 芯片的设备面世,而搭载 G52 的设备则可能会于 2019 年出现在市场上。


a24ef5f6eb359891cb7c6404ab07b4c9.jpg


相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
1月前
|
机器学习/深度学习 人工智能 TensorFlow
倚天产品介绍|倚天性能优化—YCL AI计算库在resnet50上的优化
Yitian710 作为平头哥第一代ARM通用芯片,在AI场景与X86相比,软件生态与推理性能都存在一定的短板,本文旨在通过倚天AI计算库的优化,打造适合ARM架构的软件平台,提升倚天性能
|
2月前
|
人工智能 JSON 数据格式
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
54 0
|
8天前
|
存储 机器学习/深度学习 网络协议
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
阿里云企业级ARM计算规格族是阿里云继X86计算、异构计算、弹性裸金屈服务器、超级计算集群之后推出的全新架构云服务器,ARM计算规格族有通用型实例规格族g8y、计算型实例规格族c8y、通用型实例规格族g6r等。下面是阿里云企业级ARM计算规格族特点、适用场景及最新收费标准和活动价格参考。
阿里云企业级ARM计算规格族特点、适用场景及收费标准与活动价格参考
|
1月前
|
存储 机器学习/深度学习 并行计算
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
在我们选购阿里云服务器的时候,云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选,有的用户并不清楚他们之间有何区别,本文主要简单介绍下不同类型的云服务器有何不同,主要特点及适用场景有哪些。
阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、高性能计算架构区别
|
1月前
|
人工智能 前端开发 数据挖掘
Arm 发布 Neoverse 新品:数据分析性能提升 196%,奠定未来计算及 AI 的基石
北京时间 2 月 22 日,半导体巨头 Arm 更新了 Arm® Neoverse™ 产品路线图,宣布推出两款基于全新第三代 Neoverse IP 构建的全新计算子系统(CSS):Arm Neoverse CSS V3 和 Arm Neoverse CSS N3。
|
1月前
|
存储 人工智能 弹性计算
倚天使用|倚天性能优化—YCL AI计算库在resnet50上的优化
本文介绍了x86软件迁移到Arm过程中可能遇到的弱内存序问题的解决方案,解析了弱内存序问题的根因,介绍了Hawkeyes的架构和实现原理。欢迎有需求的团队发送邮件咨询
|
2月前
|
人工智能 安全 Android开发
OPPO召开AI战略发布会,联发科天玑芯构建AI手机时代计算底座
近期,OPPO举办AI战略发布会,会上正式推出了由OPPO AI超级智能体与AI Pro智能体开发平台共同构建的OPPO 1+N智能体生态战略。与此同时,OPPO与联发科展开深度合作,展示了双方在AI手机领域的创新成果,以共同推进“AI手机(AI Smartphone)”的发展,为广大用户带来更为智能、便捷和高效的下一代AI体验。
|
2月前
|
人工智能 Serverless API
AI 绘画平台难开发,难变现?试试 Stable Diffusion API Serverless 版解决方案
AI 绘画平台难开发,难变现?试试 Stable Diffusion API Serverless 版解决方案
|
2月前
|
人工智能 数据可视化 算法
AI Earth ——开发者模式案例3:典型植被指数计算及区域统计
AI Earth ——开发者模式案例3:典型植被指数计算及区域统计
45 1
|
2月前
|
存储 机器学习/深度学习 人工智能
基于 SRAM 的存内计算助力实现节能 AI
基于 SRAM 的存内计算助力实现节能 AI
86 0