活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

简介: 活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

AI 势不可挡,“智算”赋能未来。2024 年 1 月 5 日,云原生技术实践营「云原生 AI &大数据」专场在上海落幕。活动聚焦容器、可观测、微服务产品技术领域,以云原生 AI 工程化落地为主要方向,希望帮助企业和开发者更快、更高效地落地云原生 AI 系统。


0105 云原生技术实践营-上海站 活动现场


此次活动吸引了金融科技、制造、汽车、健康医疗、在线旅游、新茶饮等领域的近百位开发者参与。活动现场,阿里云一线工程师围绕《基于 Kubernetes 的云原生 AI 工程化落地实践》、《容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战》、《如何应对大规模异构计算集群的运维和管理挑战?》、《业务容器化过程中,构建高性能云原生网关的实践》、《构建安全、高效、弹性的 Serverless 混合云容器 AI 平台》以及《面向智算服务,构建可观测体系最佳实践》6 个当下热门议题与现场的开发者、技术爱好者展开交流。


活动结尾,阿里云技术专家带领大家参与动手体验——基于容器搭建企业级应用、基于 ACK Serverless 轻松部署企业级 Stable Diffusion,让开发者们真正体验到基于容器和镜像如何快速搭建一个企业级的应用,以及在容器服务 Serverless 版中,如何通过 Knative 部署满足企业级弹性需求的 Stable Diffusion 服务,同时通过对该服务进行压测实验,体验到了 ACK Serverless 的弹性能力。


相关阅读:基于容器平台 ACK 快速搭建 Stable Diffusion


关注公众号,后台回复:0105

免费获得上海站讲师 PPT 合辑


01 月 10 日 (周三)14:00-17:00,我们将在【阿里云云原生】视频号对本场活动进行线上直播回放,欢迎预约。


精彩回顾


下面就让我们一起回顾本次活动上都有哪些精彩瞬间,扫描下方金句海报二维码即可预约本场活动直播回放。


01 分享主题丨基于 Kubernetes 的云原生 AI 工程化落地实践


为了满足日益增长的算力需求、更高的业务稳定性要求,以及更快的创新和迭代交付,越来越多企业选择在云上开发、训练和部署 AI 模型,利用云计算的优势,获取稳定、弹性的大规模异构算力,从而提高算法迭代和应用落地的效率,并提升规模化服务的可靠性。活动现场,阿里云研发工程师徐之浩分享了云原生 AI 的发展背景和落地挑战,以及 ACK 云原生 AI 套件在智算时代的能力升级,包括 LLM/AIGC 的快速部署和加速推理,以及弹性分布式训练等最佳实践。



02 分享主题丨容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战


紧接着,阿里云技术专家刘佳旭围绕 K8s 集群稳定性的衡量标准和大规模场景下的挑战、ACK 针对这些挑战所做的稳定性治理和优化策略、以及 ACK 提供的稳定性产品功能和最佳实践三个方面,分享了基于 ACK 稳定性保障实践经验,帮助大家深入理解 ACK 稳定性理论和优化策略,以及如何使用相应的工具和服务进行稳定性保障。



03 分享主题丨如何应对大规模异构计算集群的运维和管理挑战?


面对大规模异构计算集群的运维和管理挑战的问题,阿里云研发工程师霍智鑫通过介绍异构计算集群运维难点、ACK GPU 集群的解决方案,为大家分享了 ACK 异构集群,对异构计算资源统一管理和调度,以及弹性伸缩、可观测,并提供共享 GPU 调度、GPU 拓扑感知调度等增强能力,提升资源使用效率。



04 分享主题丨业务容器化过程中,构建高性能云原生网关的实践


Higress Maintianer 范扬从 Higress 的发展历程开始,为大家分享了构建高性能云原生网关的最佳实践以及如何利用多集群流量调度能力实现同城容灾,同时带来了 Higress 标杆用户案例的分享,并在最后分享了 Higress 开源的未来规划。



05 分享主题丨构建安全、高效、弹性的 Serverless 混合云容器 AI 平台


以深度学习为代表的 AI 生产系统面临效率、性能和成本挑战,基于容器的AI/大数据成为云原生时代的技术趋势。在此次上海站活动现场,阿里云高级技术专家庄宇为大家分享了 IDC 自建容器 AI 平台,基于注册集群 + ECI 弹性上云以及如何通过 ACK One 实现多集群统一管理和业务部署,并通过 Fluid 实现混合云数据访问加速。



06  分享主题丨面向智算服务,构建可观测体系最佳实践


“可观测助力阿里云 AI 生态、大数据服务、容器服务构建无处不在的端到端可观测能力,同时可观测也借助生成式 AI、大模型等能力实现自身数据的深入洞察,实现互利双赢”。在活动最后的分享环节,阿里云技术专家郭雨杰为大家带来了构建面向 AI、大数据服务、容器服务的可观测体系思路与重点,以及阿里云可观测产品进展与布局,构建全栈可观测能力。



现场精彩瞬间


相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
8月前
|
人工智能 运维 Cloud Native
2025 云栖精选资料:《从云原生到 AI 原生核心技术与最佳实践》PPT 免费下载
一本合集,四大主题,覆盖 AI 原生技术的核心版图。立即获取,与行业领跑者同行,抢占 AI 原生时代的技术先机!
|
8月前
|
存储 人工智能 大数据
云栖2025|阿里云开源大数据发布新一代“湖流一体”数智平台及全栈技术升级
阿里云在云栖大会发布“湖流一体”数智平台,推出DLF-3.0全模态湖仓、实时计算Flink版升级及EMR系列新品,融合实时化、多模态、智能化技术,打造AI时代高效开放的数据底座,赋能企业数字化转型。
1487 0
|
10月前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
647 4
|
8月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
10月前
|
SQL 分布式计算 大数据
我与ODPS的十年技术共生之路
ODPS十年相伴,从初识的分布式计算到共生进化,突破架构边界,推动数据价值深挖。其湖仓一体、隐私计算与Serverless能力,助力企业降本增效,赋能政务与商业场景,成为数字化转型的“数字神经系统”。
|
10月前
|
存储 人工智能 算法
Java 大视界 -- Java 大数据在智能医疗影像数据压缩与传输优化中的技术应用(227)
本文探讨 Java 大数据在智能医疗影像压缩与传输中的关键技术应用,分析其如何解决医疗影像数据存储、传输与压缩三大难题,并结合实际案例展示技术落地效果。
|
9月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
607 14
|
11月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
381 4
|
10月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
920 0
|
9月前
|
传感器 人工智能 监控
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
278 14