开发者社区> 阿里云大数据Al技术> 正文

GTC 22 精彩看点 | 锁定阿里云机器学习 PAI 分享

简介: 3月21日,2022英伟达 GTC 大会即将拉开帷幕。此次 GTC 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。
+关注继续查看

3月21日,2022英伟达 GTC 大会即将拉开帷幕。此次 GTC 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。


GTC 22 阿里云精彩演讲提前看

[S41068] PaiSparse:面向深度学习的稀疏加速库

· 李与超,阿里云,高级算法工程师

· 朱斐文,NVIDIA, 高级算法专家

· 3 月 23 日 星期三 | 3:00 PM - 3:25 PM 北京时间

 

随着超大语言模型的流行, 如何部署超大模型正在成为迫切需要解决的问题。非结构化剪枝可以将模型规模缩小99%,让超大语言模型在单卡上部署成为可能。然而超大模型稀疏后会呈现不同的非零分布,而这些分布会直接影响硬件的计算量并影响最终的执行时间。同时与传统的 HPC 任务不同的是,基于训练后的稀疏矩阵分布的 tuning 在深度学习推理中是可以进行的。因此我们提出一个面向深度学习的稀疏加速库:PaiSparse,可以自动生成更高效的稀疏算子。实验表明,与 cuSparse 相比,PaiSparse 可以提速1.5~5倍。

 

 话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1634303703593001XjhX

 

[S41501] PTXC:使用 XLA 编译器通过云 GPU 扩展 PyTorch 训练

· 刘小勇,高级主任工程师

· 3 月 23 日 星期三 | 9:00 PM - 9:25 PM 北京时间

 

在工业界实践中,模型训练和部署的效率、规模和适配性关系到最终的应用效果。为满足PyTorch eager-first 的 GPU 编译流程,Lazy Tensor 架构被提出来。通过采用实践验证过的产品化 XLA 编译器和分布式引擎,PTXC 能在阿里云 GPU 集群中以基于编译优化的方式一键快速搭建易用、弹性且高效的 PyTorch 模型训练系统。

 

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1637553159784001rkUB

 

[S41395] 通过 PAI-Blade 更易用、更可靠地使用 TensorRT

· 邱侠斐,阿里云,主任工程师

· 郭天佑,阿里云,高级工程师

· 李澜博,阿里云,高级工程师

· 3 月 24 日 星期四 | 9:00 AM - 9:25 AM 北京时间

 

TensorRT 是英伟达推出的业界领先的推理加速器,在深度学习推理场景应用广泛,但是通过 TensorRT 来优化深度学习模型仍有一定门槛。首先,通过 TensorRT 解析模型时会遇到转换失败或表现不理想的情况。其次,从零开始搭建网络比较耗时且难以扩展。此外,在生产环境里增加新的推理框架需要严谨的评估。本次演讲将介绍如何通过一站式 AI 加速器 PAI-Blade 解决上述问题。PAI-Blade 能够实现 TensorRT 后端上的自动圈图和自动化运行。同时还可以与 TensorRT Plugin 协同工作,以实现更好的性能。目前 PAI-Blade 提供对 TensorFlow 和 PyTorch 的产品化支持。

 

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1635516028378001Pxlx

 

[S41604] 未来游戏趋势:通过阿里云弹性云手机解决方案打造云游戏

· 杨铭,阿里云,高级工程师

· 3 月 24 日 星期四|11:00 AM - 11:25 AM 北京时间

 

基于英伟达 T4 及原生的 ARM 平台,阿里云设计研发了高性能的云手游解决方案——弹性云手机,可实现虚拟化渲染及显存隔离,在确保隔离的情况下充分发挥 T4 性能。此外,弹性云手机无缝对接阿里巴巴云游戏流媒体平台,该平台兼容多种流媒体协议,并具备完整的“渲染-编码-串流”云手游架构。

 

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1638429961776001IhJm

 

[S41383] 云端 Triton 生产实践

· 李文鹏,阿里云,主任工程师

· 邱侠斐,阿里云,主任工程师

· 李澜博,阿里云,高级工程师

· 3 月 24 日 星期四 | 1:00 PM - 1:25 PM 北京时间

 

Triton 推理服务器是一款功能全面、可扩展且功能强大的推理解决方案,在边缘设备和云上皆可部署。在云上将 Triton 部署到生产环境中时,应考虑效率、可扩展性以及与 Triton 自身外的云上基础设施的集成。我们将介绍在阿里云中通过 PAI- EAS 提供 Triton 作为云服务的关键见解:1) 一键部署 Triton 集群;2) 根据请求吞吐量扩展 Triton 集群;3) 与 OSS(对象存储服务)原生集成;以及 4) Triton 和 GPU 共享调度。

 

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1635349148436001gNSE

 

 

[S41073] 阿里云基于 AI 编译器的通用透明性能解决方案

· 朱凯,阿里云,主任工程师

· 3 月 24 日 星期四 | 2:00 PM - 2:50 PM 北京时间

 

本次演讲将从云服务厂商的视角,分享在云端和机器学习平台上大规模部署 AI 编译器的实战经验。我们将详细介绍近期刚刚开源的动态 shape 深度学习编译器 BladeDISC,包括它的背景和主要特性,具体设计架构和实现细节,动态 shape 语义下的性能优化经验,未来计划以及在 NVIDIA 设备上的应用等。

 

话题链接:https://www.nvidia.com/gtc/session-catalog/#/session/1634431966251001JhrZ

 

GTC 22 阿里云精彩演讲锁定攻略!

 

1. 点击访问 GTC 22 官网  https://www.nvidia.cn/gtc-global/?ncid=GTC-NVMAGGIEJ

2. 注册 GTC 22

3. 登录后可将会议添加至会议日程如下图

4. 开始后登录即可观看会议,若错过直播时间,可登录查看会议点播,随时观看会议

 

 image1.png

 

扫描下方海报二维码,即刻注册 GTC 22,了解阿里云关于推理优化/部署、深度学习编译器、大模型部署、训练优化、云游戏等主题的精彩分享


image2.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
14225 0
如何设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云安全组设置详细图文教程(收藏起来) 阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程。阿里云会要求客户设置安全组,如果不设置,阿里云会指定默认的安全组。那么,这个安全组是什么呢?顾名思义,就是为了服务器安全设置的。安全组其实就是一个虚拟的防火墙,可以让用户从端口、IP的维度来筛选对应服务器的访问者,从而形成一个云上的安全域。
19003 0
GTC 22 精彩看点 | 锁定阿里云机器学习 PAI 分享
3月21日,2022英伟达 GTC 大会即将拉开帷幕。此次 GTC 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。
512 0
【ACE成长记第4期】美女程序员分享:机器学习之数据预处理到特征构建模型训练
本期由阿里云MVP&优秀ACE(阿里云开发者社群) 郭翔云 为大家分享机器学习之从数据预处理到特征构建谈天池工业AI竞赛模型训练。通过天池工业AI竞赛示例,演示从数据观察到特征构建,再到模型训练验证评估的一个机器学习的完整流程。
1825 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
28221 0
Arch Summit 2017 分享 机器学习分会场,金融分会场
ArchSummit是由极客帮,Qcom组织的业界架构师会议。主要是各个厂商技术人员之间进行技术交流的会议,各个公司希望建立更好的技术口碑,技术人员希望在交流中提升自己的水平,开拓视野。说实在的,以我在美国工作的经验,美国公司是不会允许在交流分享中给出这么多干货的,尤其是比较新的,当前在研发的系统。同事们也发现,在这次ArchSummit上,如果是海外公司的介绍,一般都比较虚,国内公司,尤其是小公
1309 0
+关注
阿里云大数据Al技术
阿里云大数据Al技术
27
文章
0
问答
来源圈子
更多
相关文档: 机器学习平台PAI
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载