阿里云高级技术专家李鹏:AI基础设施的演进与挑战 | GenAICon 2024

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 4vCPU 16GiB,适用于搭建游戏自建服
简介: 阿里云高级技术专家、阿里云异构计算AI推理团队负责人李鹏将在主会场第二日上午的AI Infra专场带来演讲,主题为《AI基础设施的演进与挑战》。

  图片1.jpg


ChatGPT面世以来,生成式AI已加速狂飙16个月,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。


AI大模型飞速迭代,创新应用层出不穷。我们正处于技术野蛮生长的爆发时刻,见证着AI向通用人工智能全速冲刺的破竹之势。


值此之际,由智一科技旗下智东西联合智猩猩发起主办的2024中国生成式AI大会将于418-19日在北京JW万豪酒店举办。今年大会以“重构世界 奔赴未来”为主题,拟邀请50+位重量级嘉宾同台分享,以前瞻性视野全景式解构生成式AI的时与势、危与机、破与立。这是继2023年举办国内首场聚焦AIGC的高规格创新峰会后,智一科技旗下智东西联合智猩猩发起主办的第二届生成式AI行业盛会。


大会由主会场峰会+分会场研讨会/论坛+展览+榜单组成,其中主会场第一日将进行开幕式、大模型专场,第二日将进行 AI Infra 专场、AIGC 应用专场;分会场第一日下午将进行智猩猩具身智能技术研讨会,第二日上下午分别进行智猩猩 AI 智能体技术研讨会、以及中国智算中心创新论坛。【 AI 生产力创新先锋-中国生成式 AI 企业 TOP50】榜单将在大会第二日上午正式揭晓。

 

阿里云高级技术专家、阿里云异构计算AI推理团队负责人李鹏将在主会场第二日上午的AI Infra专场带来演讲,主题为《AI基础设施的演进与挑战》。

 

嘉宾介绍

 

李鹏,阿里云异构计算高级技术专家,毕业于北京航空航天大学计算机系,目前是阿里云异构计算AI推理团队负责人,负责生成式AI推理的性能优化工作,构建了AIACCDeepGPU等阿里云AI加速套件。在GPU领域深耕近10年,其中负责的自研加速框架AIACC帮助阿里云在2020年在斯坦福DAWNBench竞赛的图像识别(Image Classification on ImageNet)榜单中,包揽了训练时间、训练成本、推理延迟以及推理成本四项第一。

 

3b803e1dcb059473cee4bf1586541f5c.png

 

演讲概要

 

人工智能当前已经迈入了快速发展的阶段,尤其是大语言模型的突飞猛进正给各行各业带来了日新月异的变化。AIGC的场景对云计算AI基础设施与产品也提出了非常鲜明的发展要求。我将从产业一线的角度与大家一起探讨面向AI与大模型计算的场景下,如何构建稳定、安全、弹性的云基础设施架构,以满足云上动辄千亿规模的参数量及极大的算力需求。

 

相关文章
|
7天前
|
人工智能 自然语言处理 文字识别
阿里云 AI 搜索开放平台新增:服务开发能力
阿里云 AI 搜索开放平台新发布:服务开发能,可通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。
|
9天前
|
人工智能 城市大脑 运维
2025数字中国建设峰会:阿里云+AI深入千行百业
近日,第八届数字中国建设峰会在福州召开。峰会期间,阿里云及通义大模型服务政企的一批领先成果被重点展示。
104 1
|
15天前
|
人工智能 开发工具
阿里云AI Stack全量适配Qwen3模型,企业级部署效率全面升级
2025年4月29日的凌晨5点,阿里全新一代模型通义千问Qwen3正式发布并全部开源8款「混合推理模型」,包含: 6款Dense模型:0.6B、1.7B、4B、8B、14B、32B。 2款MoE模型:Qwen3-30B-A3B和旗舰版Qwen3-235B-A22B。 阿里云AI Stack已适配全量Qwen3模型,可快速部署实现Qwen3模型的开箱即用!
|
7天前
|
人工智能 数据挖掘 大数据
“龟速”到“光速”?算力如何加速 AI 应用进入“快车道”
阿里云将联合英特尔、蚂蚁数字科技专家,带来“云端进化论”特别直播。
48 11
|
21天前
|
开发框架 人工智能 Java
破茧成蝶:传统J2EE应用无缝升级AI原生
本文探讨了技术挑战和解决方案,还提供了具体的实施步骤,旨在帮助企业顺利实现从传统应用到智能应用的过渡。
破茧成蝶:传统J2EE应用无缝升级AI原生
|
8天前
|
开发框架 人工智能 Java
破茧成蝶:阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代
本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分:第一部分阐述了传统J2EE应用在智能化转型中的痛点,如协议鸿沟、资源冲突和观测失明;第二部分展示了阿里云应用服务器的解决方案,包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性;第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程,确保十年代码无需重写,轻松实现智能化跃迁。
|
1月前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
231 29
|
17天前
|
数据采集 人工智能 大数据
演讲实录:中小企业如何快速构建AI应用?
AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。
|
18天前
|
人工智能 搜索推荐 API
AI赋能大学计划·大模型技术与应用实战学生训练营——华东师范大学站圆满结营
4月24日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行大模型应用实战学生训练营——华东师范大学站圆满结营。
62 2
|
1月前
|
存储 人工智能 监控
一键部署 Dify + MCP Server,高效开发 AI 智能体应用
本文将着重介绍如何通过 SAE 快速搭建 Dify AI 研发平台,依托 Serverless 架构提供全托管、免运维的解决方案,高效开发 AI 智能体应用。
3264 64