GTC 2023 | 阿里云弹性计算团队专家演讲推荐

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
简介: 了解云上弹性磅礴算力背后的关键技术

GTC 2023 大会现已进入倒计时!这场囊括 650 多场演讲、专家座谈会以及特别活动组成的 AI 盛宴,将于3 20 – 23 日在线上拉开帷幕,预计将有超过 25 万人报名参加。包括Open AI 的联合创始人兼首席科学家Ilya StutskeverDeepMind 的创始人兼CEO Demis Hassabis 都将出席。


本次 GTC 大会,来自阿里云弹性计算团队的技术和产品专家,分享话题涵盖:基于阿里云弹性RDMAeRDMA) 技术训练实例提升多机训练性能、视觉计算领域的思考和实践、使用弹性GPU 计算服务和神龙 AI 加速引擎优化 AI 训练性能的软硬协同技术;上述领域的技术和解决方案,也融合了 NVIDIA GPURTX 实时光线追踪、CloudXR 无线 AR/VR 串流技术。

 

点击阅读原文,免费注册,提前将阿里云弹性计算团队专家演讲加入您的GTC日程:

 

随着数字化浪潮的扩大和企业数字化转型需求的增加,中国云计算市场规模持续扩张。根据工信部数据显示,到2022年,中国云计算产业规模超过3000亿元,增速保持高位。


同时,云计算的应用也在不断向更广泛的领域延伸。在这一年,上云的主体用户已经从仅限于互联网企业向各个行业的企业平滑过渡。云计算逐渐从基础资源层向云平台、云应用层面延伸,成为数字经济中不可或缺的“底座”。


然而,企业对云计算的需求也在不断提高。传统的中心云拥有大型的基础设施支持,以资源池化和多租户的方式提供服务;而现在很多企业用户则希望数据可以本地专属,并且需要云计算与用户之间协同工作。


阿里云是全球领先的云计算服务提供商。经过十年的发展,阿里云弹性计算已经随着阿里云业务全球化的步伐,服务覆盖全球200个国家和地区。在中国,超过80%的中国科技创新企业在使用阿里云弹性计算产品。


2017年,阿里云弹性计算推出异构计算产品家族,目前已经形成了丰富的软硬协同产品体系,包括搭载 NVIDIA T4A10V100 GPU 的弹性计算实例,以及相关软件工具,如神龙 AI 加速引擎 AIACC、集群极速构建工具 FastGPUcGPU 容器技术等,同时也发展出来解耦的加速实例 EAIS,让异构计算更具柔性。基于上述产品,异构计算帮助深度学习、图形处理、云游戏、远程渲染、云VR/AR、云转码、云设计等业务降本增效。

 

阿里云弹性计算团队专家演讲推荐


基于阿里云 eRDMA 的训练实例大幅提升多机训练性能

 

会议代码:[S52281]


演讲时间:3月2310:00AM


演讲嘉宾:

李伟男.png

李伟男,阿里云弹性计算高级技术专家

 

宋迪.png

宋迪,阿里云弹性计算产品专家


演讲概要:

 

随着互联网数据量指数级膨胀,数据中心分布式计算的规模以及大规模集群间的数据传输开销也越来越大。弹性RDMAeRDMA) 技术相比传统 TCP 网络,能够大幅降低网络通信延迟,大幅提升分布式计算的性能和性价比。eRDMA 依托阿里云神龙架构,结合NVIDIA GPU 的算力支撑以及兼容 IB verbs 的协议软件接口,最终客户可以无缝迁移线下RDMA 业务上云或者云上实例无缝升级到 eRDMA。本次演讲将分享如何基于阿里云eRDMA 的训练实例大幅提升多机训练性能。

 

 

阿里云视觉计算解决方案思考与实践

 

会议代码:[S52269]


演讲时间:322日即可在线观看(点播形式)

 

演讲嘉宾:

 

张新涛.png

张新涛,阿里云弹性计算产品专家

 

演讲概要:

 

数字人、元宇宙等众多概念在近年来异常火热。虽然 “完全复刻一个虚拟世界” 这样的未来,依然显得十分遥远,但在 2022 年依然有不少落地的探索,比如虚拟偶像与代言人、2D 体验 3D 化、沉浸式演唱会与沉浸式会议等新形式,都在展会、文娱、新零售等行业率先试水。针对这类场景,阿里云推出了视觉计算解决方案,并在上述行业落地了不少实践。本次演讲将为大家分享阿里云在视觉计算领域的思考与实践。

 

基于阿里云弹性 GPU 服务的神龙AI 加速引擎无缝提升 AI 训练性能

 

会议代码:[S52280]


演讲时间:322日即可在线观看(点播形式)

 

演讲嘉宾:

 

林立翔.png

林立翔,阿里云弹性计算高级技术专家


演讲概要:


AI 训练场景是对通信能力和计算能力均有超高需求的业务。围绕 AI 训练在 IAAS 上的竞争力构建,阿里云创造性地实现了以弹性 RDMAeRDMA) 等为代表的软硬协同 AI 加速引擎来提升云上 AI 训练性能。本演讲将聚焦云上 AI 训练的真实业务痛点,并解析阿里云如何通过软硬协同的优化技术来提升 AI 训练性能。

 

如何预约和注册

 

想要预约以上精彩内容?扫描海报二维码 或 点击 “阅读原文”,按照会议代码或标题,找到对应演讲。通过点击  Add to Schedule或  “星星” ,将该演讲内容添加至您的日程,大会开始后登录即可在线观看。

 

海报.png

 

 

按照 会议代码 或者 演讲标题,找到感兴趣的内容

如下图 [S52281]演讲,点击 Add to Schedule,即可添加至您的日程


配图 1.png

 

如无  Add to Schedule按钮,例如下图 [S52280],说明该演讲为自主点播形式

322日开始即可在线观看

点击右上方的 星星,将该演讲添加至您的日程

配图 2.png


如点击  Add to Schedule星星 时,出现如下界面


配图 3.png

 

如果您已注册,请点击 Login登录,激活账户,继续操作;

如果您尚未注册,请点击 Create Account,详情参看GTC23 注册教程

 

请在326日前完成在线注册,免费观看以及回看GTC 2023 春季大会超过650场精彩内容!


相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
并行计算 Cloud Native 异构计算
用尽每一寸GPU,阿里云cGPU容器技术白皮书重磅发布!
云原生已经成为业内云服务的一个趋势。在云原生上支持异构计算有助于提升CPU的利用率。一文分析业内主流GPU共享方案,并告诉你阿里云cGPU牛在哪里!阿里云异构计算推出的cGPU(container GPU)容器技术,创新地提出了一种不同于以往的GPU容器方案,克服了业内主流方案的一些常见的缺陷,在保证性能的前提下,做到了容器之间的GPU显存隔离和任务隔离,为客户充分利用GPU硬件资源进行训练和推理提供的有效保障。
9438 0
用尽每一寸GPU,阿里云cGPU容器技术白皮书重磅发布!
|
5月前
|
人工智能 架构师 关系型数据库
第二届固件技术峰会盛大召开,共探 AI 时代固件创新之路
阿里云联合字节跳动、固件联盟主办的第二届固件技术峰会在长沙顺利召开,探索AI时代固件技术发展新趋势。
|
10月前
|
运维 Kubernetes Java
阿里云容器计算服务ACS ,更普惠易用、更柔性、更弹性的容器算力
ACS是阿里云容器服务团队推出的一款面向Serverless场景的子产品,基于K8s界面提供符合容器规范的CPU及GPU算力资源。ACS采用Serverless形态,用户无需关注底层节点及集群运维,按需申请使用,秒级按量付费。该服务旨在打造更普惠易用、更柔性、更弹性的新一代容器算力,简化企业上云门槛,加速业务创新。ACS支持多种业务场景,提供通用型、性能型及BestEffort算力质量,帮助客户更从容应对流量变化,降低综合成本。
|
3月前
|
人工智能 自然语言处理 算法
蔚来汽车携手通义灵码入选 2025 世界人工智能大会标杆案例
在2025年世界人工智能大会上,通义灵码助力蔚来汽车提升研发效能,成功入选“人工智能+”行业标杆案例。蔚来已有近1000名工程师常态化使用该工具,AI生成代码占比超30%,在“天探”系统中更达70%,显著提升开发效率与代码质量,并正向更多核心领域扩展。
|
10月前
|
人工智能 弹性计算 监控
分布式大模型训练的性能建模与调优
阿里云智能集团弹性计算高级技术专家林立翔分享了分布式大模型训练的性能建模与调优。内容涵盖四大方面:1) 大模型对AI基础设施的性能挑战,强调规模增大带来的显存和算力需求;2) 大模型训练的性能分析和建模,介绍TOP-DOWN和bottom-up方法论及工具;3) 基于建模分析的性能优化,通过案例展示显存预估和流水线失衡优化;4) 宣传阿里云AI基础设施,提供高效算力集群、网络及软件支持,助力大模型训练与推理。
|
11月前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
105562 10
|
10月前
|
人工智能 数据可视化 专有云
阿里云飞天企业版获评2024年AI云典型案例
近日,由全球数字经济大会组委会主办、中国信息通信研究院和中国通信企业协会承办的“云·AI·计算国际合作论坛”作为2024全球数字经济大会系列活动之一,在北京举办。论坛以“智启云端,算绘蓝图”为主题,围绕云·AI·计算产业发展、关键技术、最佳实践等展开交流讨论。阿里云飞天企业版异构算力调度平台获评2024年AI云典型案例。
504 3
|
自然语言处理 监控 Cloud Native
对话阿里云云原生产品负责人李国强:推进可观测产品与OpenTelemetry开源生态全面融合
阿里云宣布多款可观测产品全面升级,其中,应用实时监控服务 ARMS 在业内率先推进了与 OpenTelemetry 开源生态的全面融合,极大丰富了可观测的数据类型及规模,大幅增强了 ARMS 核心能力。本次阿里云 ARMS 产品全面升级的背景是什么?为什么会产生围绕 OpenTelemetry 进行产品演进的核心策略?在云原生、大模型等新型应用架构类型层出不穷的今天,又将如何为企业解决新的挑战?阿里云云原生应用平台产品负责人李国强接受采访解答了这些疑问,点击本文走进全新升级的阿里云可观测产品。
42230 120
|
JavaScript 安全 Java
谈谈UDP、HTTP、SSL、TLS协议在java中的实际应用
下面我将详细介绍UDP、HTTP、SSL、TLS协议及其工作原理,并提供Java代码示例(由于Deno是一个基于Node.js的运行时,Java代码无法直接在Deno中运行,但可以通过理解Java示例来类比Deno中的实现)。
222 1
perf_event_open学习 —— 缓冲区管理
perf_event_open学习 —— 缓冲区管理

热门文章

最新文章