为主流价位移动设备加入AI计算:ARM发布新一代Mali解决方案

简介: 随着人工智能技术的逐渐实用化,人们对于机器学习算力的需求正在飞速增长,除英特尔、英伟达等传统芯片厂商以外,谷歌、亚马逊等公司都在致力于打造自己的专用 AI 处理器。

3 月 6 日下午,移动设备芯片设计公司 Arm 在北京举行了产品发布会,向全球发布了其人工智能计算的最新解决方案,其中包括 Mali-G52、G31 移动端显卡,Mali-D51 显示处理器以及 Mali-V52 视频处理器。


e928e246d911f4120bdc5c5669e2755a.jpg



随着人工智能技术的逐渐实用化,人们对于机器学习算力的需求正在飞速增长,除英特尔、英伟达等传统芯片厂商以外,谷歌、亚马逊等公司都在致力于打造自己的专用 AI 处理器。为了保持在移动芯片领域的领先地位,Arm 也在沿着自己的道路不断推进。2 月 14 日,该公司宣布启动 Trillium 项目,其中包括未来的专用机器学习处理器、目标检测处理器,以及神经网络软件库的 Arm IP 套件。而昨天在北京发布的新一代硬件产品则宣示了 Arm 在主流市场上已开始了自己的行动。


「目前在移动的世界里,消费者的使用行为已经发生了变化,」Arm 计算事业群市场营销资深总监 Ian Smythe 说道。「今天,手机是人通向世界的大门,Arm 作为一家企业的使命是让技术以无形的方式来让人连接世界。」


在 Arm 看来,今天移动端设备消费者行为的变化带来了三大新需求:机器学习应用、3D 视频游戏、和虚拟/增强现实。


这或许意味着未来芯片市场的格局会出现翻天覆地的变化。据估算,至 2018 年底,中国将设计和制造超过 10 亿台智能手机并销往世界,中国厂商在海外市场的份额正在以每年翻倍的速度快速增长。这样的速度使得 Arm 分外重视中国市场,该公司正在积极寻求与国内厂商在新架构上的合作。


目前,Arm 对于自己在市场上的领先地位感到满意。「目前市场上大部分移动技术都是基于 Arm 的,」Ian Smythe 介绍道,「其中包括 Cortex-A 的处理器——世界上绝大部分的智能手机都装载了 Cortex-A 系列处理器。同时 Arm 拥有一个多媒体方面的品牌 Mali,它也是全球 GPU 出货量最大的 GPU。简而言之,Arm 在全球的合作伙伴去年共计出货基于 Mali 的片上系统(SoC)达到了 12 亿片。」


e62abfb542b117f9fa5cbe73151d91c1.jpg


AI 和机器学习是现在最热门的话题,而作为被用到最多的计算设备,手机等移动设备则是机器学习的重要应用场景。很多用户已经在不知情的情况下享受到了机器学习带来的便利。事实上,在搜索、机器翻译和照相等应用的背后都有机器学习的身影。


作为最大的移动端芯片设计者,Arm 的产品是机器学习计算的重要承载设备。根据 IDC 统计,目前市场上 90% 的 AI 计算由 Arm 来实现的。


与华为、苹果推出的深度学习芯片相对应,Arm 在 2017 年推出了 DynamIQ 异构计算解决方案。DynamIQ 完全改变了 Cortex 系列处理器的部署方式,它为 CPU 引入了一系列全新指令集,极大提升了人工智能计算的性能。同时它也极大地提高了多核计算的灵活性,在 8 核处理器系统中(1 大核加 7 小核),DynamIQ 实现了在同样的硅面积之下,总体线程性能翻一番,与此同时,它也能实现高性能的双四核布局。


在发布会上,Arm 发布了全新的 Mali-G52、G31 移动端显卡,Mali-D51 显示处理器以及 Mali-V52 视频处理器设计。据介绍,新一代芯片设计在机器学习计算性能上有了大幅提升,适用于主流市场上的手机、智能电视等设备。


Mali G52 GPU 的上一代 G51 是正好在一年以前发布的,时隔一年,新一代的产品就已获得了性能密度 30% 的提升,性能效率比 15% 提升,而在机器学习能力上,新一代设计更是获得了 3.6 倍的性能提升。


62d053d31eb21c8541c0b85df9cc9cf0.jpg


Mali-G52 采用典型的四核布局。其执行引擎由 G51 中的四线程扩展到了八线程。因此在复杂的指令上,它能够实现两倍的性能,因此在芯片面积上 G52 是 G51 的 1.2 倍,但性能上前者却是后者的两倍。为了更好地支持机器学习,Arm 也加入了一些具体的指令,其中包含英特尔一直以来支持的一些指令,在 ImageNet 图像分类与 Yolo network 卷积层性能测试中,G52 的性能相对前代产品都有了非常大的提升。


87ec2ccc51f533f014091173be8460ae.jpg

在显示芯片上,Arm 配套推出了 Mali D51,它是去年 DP650 的继承者。相较前代产品性能密度提升了一倍,通过使用 Offload 技术,它的性能效率则有 30% 的提升,同时内存时延减少了 50%。


通过把 Mali-D51 和 Assertive Display5、HDR10 结合在一起。Arm 的解决方案可以让目前主流价位设备的显示屏都能实现 HDR4K 画质,从而进一步提升产品的竞争力。


0e05cf62c2e7657eab9e23e2bd2276ec.jpg

Mali-V52 则是基于 Arm 多核 Video 的视频输出解决方案。与前代产品 Mali-V61 相比较,其在解码性能方面有了一倍提升,硅晶片面积降低了近 40%,同时在视频的质量上提升了 20%。针对于一些特定的使用场景,Arm 能够提供优化解决方案。如在智能电视应用上,基于 Mali-V52 的设备可以在一个电视显示屏上同步展示多达 16 个视频流。


1743586cb335f39597a1f0108b02274b.jpg

与此同时,Arm 还推出了面向低端市场的新一代 GPU Mail-G31,它也是 G30 系列,Bifrost 架构家族中的第一款 GPU。它和 Mali-G51 采用的架构技术是一样的,但总硅面积降低了 20%,在性能密度上也有 20% 的提高,同时在 UI 性能方面有 12% 的提升。


95901ce3abc7af5454f2bbb4e70dc37b.jpg


至此,Arm 的下一代中/低端视频处理芯片解决方案的组件已全部推出,这家公司正在积极推进新设计的产品落地。Ian Smythe 表示,目前已经有很多合作伙伴正在开发基于 Mali V52、D51 的产品。在 GPU 方面,预计在今年晚些时候我们就将在市场上看到搭载 Mali G31 芯片的设备面世,而搭载 G52 的设备则可能会于 2019 年出现在市场上。


a24ef5f6eb359891cb7c6404ab07b4c9.jpg


相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
1月前
|
人工智能 监控 安全
员工使用第三方AI办公的风险与解决方案:从三星案例看AI的数据防泄漏
生成式AI提升办公效率,也带来数据泄露风险。三星、迪士尼案例揭示敏感信息外泄隐患。AI-FOCUS团队建议构建“流式网关+DLP”防护体系,实现分级管控、全程审计,平衡安全与创新。
|
1月前
|
人工智能 小程序 Java
电子班牌管理系统源代码,基于AI人脸识别技术的智能电子班牌云平台解决方案
电子班牌管理系统源码,基于AI人脸识别的智慧校园云平台,支持SaaS架构,涵盖管理端、小程序与安卓班牌端。集成考勤、课表、通知、门禁等功能,提供多模式展示与教务联动,助力校园智能化管理。
147 0
|
3月前
|
人工智能 安全 数据中心
|
4月前
|
运维 监控 关系型数据库
AI 时代的 MySQL 数据库运维解决方案
本文探讨了大模型与MySQL数据库运维结合所带来的变革,介绍了构建结构化运维知识库、选择合适的大模型、设计Prompt调用策略、开发MCP Server以及建立监控优化闭环等关键步骤。通过将自然语言处理能力与数据库运维相结合,实现了故障智能诊断、SQL自动优化等功能,显著提升了MySQL运维效率和准确性。
447 18
|
4月前
|
人工智能 自然语言处理 运维
阿里云 X 瓴羊:AI Stack一体机上新解决方案,重构企业问数与客服交互
简介:瓴羊基于阿里云AI Stack推出智能问数与智能客服一体机,以“低成本、零门槛”实现数据分析与客服效率的显著提升,助力企业智能化升级。
492 0
|
4月前
|
数据采集 人工智能 大数据
10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。
461 0
|
2月前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
|
1月前
|
人工智能 并行计算 PyTorch
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
208 4
|
3月前
|
人工智能 自然语言处理 机器人
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
|
2月前
|
人工智能 异构计算
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!
敬请锁定《C位面对面》,洞察通用计算如何在AI时代持续赋能企业创新,助力业务发展!