活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

AI 势不可挡,“智算”赋能未来。2024 年 1 月 5 日,云原生技术实践营「云原生 AI &大数据」专场在上海落幕。活动聚焦容器、可观测、微服务产品技术领域,以云原生 AI 工程化落地为主要方向,希望帮助企业和开发者更快、更高效地落地云原生 AI 系统。


0105 云原生技术实践营-上海站 活动现场


此次活动吸引了金融科技、制造、汽车、健康医疗、在线旅游、新茶饮等领域的近百位开发者参与。活动现场,阿里云一线工程师围绕《基于 Kubernetes 的云原生 AI 工程化落地实践》、《容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战》、《如何应对大规模异构计算集群的运维和管理挑战?》、《业务容器化过程中,构建高性能云原生网关的实践》、《构建安全、高效、弹性的 Serverless 混合云容器 AI 平台》以及《面向智算服务,构建可观测体系最佳实践》6 个当下热门议题与现场的开发者、技术爱好者展开交流。


活动结尾,阿里云技术专家带领大家参与动手体验——基于容器搭建企业级应用、基于 ACK Serverless 轻松部署企业级 Stable Diffusion,让开发者们真正体验到基于容器和镜像如何快速搭建一个企业级的应用,以及在容器服务 Serverless 版中,如何通过 Knative 部署满足企业级弹性需求的 Stable Diffusion 服务,同时通过对该服务进行压测实验,体验到了 ACK Serverless 的弹性能力。


相关阅读:基于容器平台 ACK 快速搭建 Stable Diffusion


关注公众号,后台回复:0105

免费获得上海站讲师 PPT 合辑


01 月 10 日 (周三)14:00-17:00,我们将在【阿里云云原生】视频号对本场活动进行线上直播回放,欢迎预约。


精彩回顾


下面就让我们一起回顾本次活动上都有哪些精彩瞬间,扫描下方金句海报二维码即可预约本场活动直播回放。


01 分享主题丨基于 Kubernetes 的云原生 AI 工程化落地实践


为了满足日益增长的算力需求、更高的业务稳定性要求,以及更快的创新和迭代交付,越来越多企业选择在云上开发、训练和部署 AI 模型,利用云计算的优势,获取稳定、弹性的大规模异构算力,从而提高算法迭代和应用落地的效率,并提升规模化服务的可靠性。活动现场,阿里云研发工程师徐之浩分享了云原生 AI 的发展背景和落地挑战,以及 ACK 云原生 AI 套件在智算时代的能力升级,包括 LLM/AIGC 的快速部署和加速推理,以及弹性分布式训练等最佳实践。



02 分享主题丨容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战


紧接着,阿里云技术专家刘佳旭围绕 K8s 集群稳定性的衡量标准和大规模场景下的挑战、ACK 针对这些挑战所做的稳定性治理和优化策略、以及 ACK 提供的稳定性产品功能和最佳实践三个方面,分享了基于 ACK 稳定性保障实践经验,帮助大家深入理解 ACK 稳定性理论和优化策略,以及如何使用相应的工具和服务进行稳定性保障。



03 分享主题丨如何应对大规模异构计算集群的运维和管理挑战?


面对大规模异构计算集群的运维和管理挑战的问题,阿里云研发工程师霍智鑫通过介绍异构计算集群运维难点、ACK GPU 集群的解决方案,为大家分享了 ACK 异构集群,对异构计算资源统一管理和调度,以及弹性伸缩、可观测,并提供共享 GPU 调度、GPU 拓扑感知调度等增强能力,提升资源使用效率。



04 分享主题丨业务容器化过程中,构建高性能云原生网关的实践


Higress Maintianer 范扬从 Higress 的发展历程开始,为大家分享了构建高性能云原生网关的最佳实践以及如何利用多集群流量调度能力实现同城容灾,同时带来了 Higress 标杆用户案例的分享,并在最后分享了 Higress 开源的未来规划。



05 分享主题丨构建安全、高效、弹性的 Serverless 混合云容器 AI 平台


以深度学习为代表的 AI 生产系统面临效率、性能和成本挑战,基于容器的AI/大数据成为云原生时代的技术趋势。在此次上海站活动现场,阿里云高级技术专家庄宇为大家分享了 IDC 自建容器 AI 平台,基于注册集群 + ECI 弹性上云以及如何通过 ACK One 实现多集群统一管理和业务部署,并通过 Fluid 实现混合云数据访问加速。



06  分享主题丨面向智算服务,构建可观测体系最佳实践


“可观测助力阿里云 AI 生态、大数据服务、容器服务构建无处不在的端到端可观测能力,同时可观测也借助生成式 AI、大模型等能力实现自身数据的深入洞察,实现互利双赢”。在活动最后的分享环节,阿里云技术专家郭雨杰为大家带来了构建面向 AI、大数据服务、容器服务的可观测体系思路与重点,以及阿里云可观测产品进展与布局,构建全栈可观测能力。



现场精彩瞬间


相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
1月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
442 30
|
1月前
|
人工智能 运维 Cloud Native
2025 云栖精选资料:《从云原生到 AI 原生核心技术与最佳实践》PPT 免费下载
一本合集,四大主题,覆盖 AI 原生技术的核心版图。立即获取,与行业领跑者同行,抢占 AI 原生时代的技术先机!
|
1月前
|
人工智能 Cloud Native 关系型数据库
云栖重磅|瑶池数据库:从云原生数据底座向“AI就绪”的多模态数据底座演进
瑶池数据库:从云原生数据底座向“AI就绪”的多模态数据底座演进
|
1月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
6月前
|
人工智能 Cloud Native 安全
云原生+AI 为企业出海提供全新技术引擎!明天见
5月22日 14:00「飞天发布时刻」,阿里云云原生应用平台产品负责人李国强将重磅揭晓面向 AI 场景的云原生产品体系升级,通过弹性智能的全球一体化架构、开箱即用的云原生 AI 工程化能力,为中国企业出海提供全新技术引擎。
|
6月前
|
存储 人工智能 Cloud Native
【发布实录】云原生+AI,助力企业全球化业务创新
本文介绍了阿里云在云原生与AI结合领域的最新产品发布和技术创新。首先,通过弹性智能的一体化架构,阿里云为AI场景提供了开箱即用的云原生能力,助力企业出海。其次,详细解析了云原生如何助力AI应用构建,包括Function AI平台、GPU极速模式、MCP Server开发托管及AI网关等核心功能。
|
10月前
|
人工智能 运维 Cloud Native
云原生 Meetup,AI 应用工程化专场·广州站
欢迎莅临广州市海珠区鼎新路 88 号广州阿里中心,O-N-10-02 春秋书院。报名成功后,您将在活动前一周收到短信通知。
172 91
|
人工智能 Cloud Native Java
活动回顾丨云原生开源开发者沙龙·杭州站回放 & PPT 下载
11 月 08 日,云原生开源开发者沙龙丨AI 应用工程化专场在杭州顺利举办。
237 75
活动回顾丨云原生开源开发者沙龙·杭州站回放 & PPT 下载
|
人工智能 Cloud Native 安全
从云原生到 AI 原生,谈谈我经历的网关发展历程和趋势
本文整理自阿里云智能集团资深技术专家,云原生产品线中间件负责人谢吉宝(唐三)在云栖大会的精彩分享。讲师深入浅出的分享了软件架构演进过程中,网关所扮演的各类角色,AI 应用的流量新特征对软件架构和网关所提出的新诉求,以及基于阿里自身实践所带来的开源贡献和商业能力。
548 105
|
人工智能 运维 Cloud Native
云原生开源开发者沙龙丨AI 应用工程化专场杭州站邀您参会
云原生开源开发者沙龙 AI 原生应用架构专场,邀您一起交流,探索 AI 原生应用的工程化落地!
205 83