阿里云张新涛:大模型时代如何应对大算力挑战|阿里云弹性计算技术公开课直播预告

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
简介: 此次公开课,张新涛首先会从大模型的发展趋势、算力需求、AI应用场景的发展三个方面,介绍大模型时代的特点;之后,他将分享从互联网、移动互联网,到大模型时代,三个不同阶段的计算基础设施特性及演进历程。最后,张新涛还会对阿里云软硬件一体的智能计算基础设施,及其面向AI大模型的训练和推理方案进行深入讲解。本次课程将在阿里云官网、钉钉视频号、阿里云官方视频号、阿里云创新中心直播平台&视频号、阿里云开发者视频号等多个官方平台同步播出。

技术圈.png


6月起,阿里云弹性计算团队将联合智东西公开课共同出品「阿里云弹性计算技术公开课」阿里云弹性计算产品专家张新涛作为首位讲师,将带来主题为《大模型时代如何应对大算力挑战》的精彩分享。

 

大模型开启了人工智能的新时代,但其动辄千亿规模的参数量、极大的算力需求同时也对计算基础设施提出了更高的要求和挑战。阿里云弹性计算基础设施,通过从底层到中间件的全系优化,能够为大模型提供软硬件一体、弹性灵活的AI算力支持。

 

本节公开课,张新涛首先会从大模型的发展趋势、算力需求、AI应用场景的发展三个方面,介绍大模型时代的特点;之后,他将分享从互联网、移动互联网,到大模型时代,三个不同阶段的计算基础设施特性及演进历程。最后,张新涛还会对阿里云软硬件一体的智能计算基础设施,及其面向AI大模型的训练和推理方案进行深入讲解。


本次课程将在阿里云官网、钉钉视频号、阿里云官方视频号、阿里云创新中心直播平台&视频号、阿里云开发者视频号等多个官方平台同步播出。

 

公开课主题:大模型时代如何应对大算力挑战


1、大语言模型开启人工智能新的时代

2、智能计算是提升大模型应用快速落地的基础

3、软硬一体的阿里云智能计算基础设施

4、面向AI大模型训练与推理的解决方案

 

主讲人:张新涛,阿里云弹性计算产品专家,负责异构计算软件及解决方案、产品管理与上市,产品经营工作;曾主导设计异构GPU产品、弹性加速实例产品、弹性云桌面产品等重要产品。从事云计算产品及技术研发12年,公共云技术研发与产品管理10年,异构计算产品管理7年。

 

阿里云官网直播时间:6月2510:00-11:00


即刻扫描下方二维码 / 点击链接,免费预约直播


视频号封面-张新涛.jpg

 


 

相关文章
|
2月前
|
SQL 人工智能 自然语言处理
阿里云 CIO 蒋林泉:AI 大模型时代,我们如何用 RIDE 实现 RaaS 的首次落地?
本文整理自阿里云智能集团 CIO 蒋林泉在 AICon 2025 深圳的演讲,分享了阿里云在大模型应用落地中的实践经验。通过多个数字人项目案例,探讨了企业在 AI 应用中的组织转型、业务识别、产品定义与工程落地等关键环节,并提出了 RIDE 方法论(重组、识别、定义、执行),助力企业实现 AI 有效落地。
|
4月前
|
存储 运维 数据挖掘
革新智能驾驶数据挖掘检索效率!某国内新能源汽车未来出行领导者选择阿里云Milvus构建多模态检索引擎
在智能驾驶技术快速发展中,数据成为驱动算法进步的核心。某新能源汽车领军企业基于阿里云Milvus向量数据库构建智能驾驶数据挖掘平台,利用其高性能、可扩展的相似性检索服务,解决了大规模向量数据检索瓶颈问题,显著降低20%以上成本,缩短模型迭代周期,实现从数据采集到场景挖掘的智能化闭环,加速智能驾驶落地应用。
革新智能驾驶数据挖掘检索效率!某国内新能源汽车未来出行领导者选择阿里云Milvus构建多模态检索引擎
|
4月前
|
存储 机器学习/深度学习 缓存
阿里云AirCache技术实现多模态大模型高效推理加速,入选国际顶会ICCV2025
阿里云研发的AirCache技术被计算机视觉顶会ICCV2025收录,该技术通过激活跨模态关联、优化KV缓存压缩策略,显著提升视觉语言模型(VLMs)的推理效率与存储性能。实验表明,在保留仅10%视觉缓存的情况下,模型性能下降小于1%,解码延迟最高降低66%,吞吐量提升达192%。AirCache无需修改模型结构,兼容主流VLMs,已在教育、医疗、政务等多个行业落地应用,助力多模态大模型高效赋能产业智能化升级。
413 1
|
2月前
|
存储 机器学习/深度学习 人工智能
云栖 2025|阿里云 Qwen3 系列领衔:AI 模型全栈突破与开发者落地指南
阿里云发布Qwen3全栈AI体系,七大模型升级、性能全球领先,开源生态稳居第一。从底层基建到开发工具链全面优化,助力企业高效落地AI应用,共建超级AI云生态。
1360 11
|
2月前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
阿里云 Qwen3 全栈 AI 模型:技术解析、开发者实操指南与 100 万企业落地案例
阿里云发布Qwen3全栈AI体系,推出Qwen3-Max、Qwen3-Next等七大模型,性能全球领先,开源生态超6亿次下载。支持百万级上下文、多模态理解,训练成本降90%,助力企业高效落地AI。覆盖制造、金融、创作等场景,提供无代码与代码级开发工具,共建超级AI云生态。
762 6
|
2月前
|
人工智能 API
阿里云百炼API-KEY在哪查询?如何获取阿里云AI百炼大模型的API-KEY?
阿里云百炼是阿里云推出的AI大模型平台,用户可通过其管理控制台获取API-KEY。需先开通百炼平台及大模型服务,即可创建并复制API-KEY。目前平台提供千万tokens免费额度,详细操作流程可参考官方指引。
|
4月前
|
缓存 人工智能 负载均衡
Scale Up!阿里云让大模型一体机真正实现“算得快”、“用得好”
当前,人工智能技术快速发展,中国智能计算市场进入成长期。大模型推理场景面临实时性、负载均衡与成本控制等多重挑战。阿里云通过芯片算子库升级、模型量化创新及推理引擎优化,实现性能加速,并应用于AI Stack训推一体机和百炼专属版等产品,支持大规模模型高效运行,显著提升性价比与用户体验。
768 0
|
4月前
|
人工智能 安全 数据可视化
安全领航!阿里云AI Stack一体机首批通过国家信通院大模型安全能力认证
在人工智能深度渗透千行百业的当下,阿里云AI Stack一体机首批通过中国信通院《大模型一体机安全能力要求》标准评估,成为国内首批在系统架构上达标的标杆产品,标志着企业级大模型部署迈入安全可信新阶段。
433 0

热门文章

最新文章