活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

AI 势不可挡,“智算”赋能未来。2024 年 1 月 5 日,云原生技术实践营「云原生 AI &大数据」专场在上海落幕。活动聚焦容器、可观测、微服务产品技术领域,以云原生 AI 工程化落地为主要方向,希望帮助企业和开发者更快、更高效地落地云原生 AI 系统。


0105 云原生技术实践营-上海站 活动现场


此次活动吸引了金融科技、制造、汽车、健康医疗、在线旅游、新茶饮等领域的近百位开发者参与。活动现场,阿里云一线工程师围绕《基于 Kubernetes 的云原生 AI 工程化落地实践》、《容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战》、《如何应对大规模异构计算集群的运维和管理挑战?》、《业务容器化过程中,构建高性能云原生网关的实践》、《构建安全、高效、弹性的 Serverless 混合云容器 AI 平台》以及《面向智算服务,构建可观测体系最佳实践》6 个当下热门议题与现场的开发者、技术爱好者展开交流。


活动结尾,阿里云技术专家带领大家参与动手体验——基于容器搭建企业级应用、基于 ACK Serverless 轻松部署企业级 Stable Diffusion,让开发者们真正体验到基于容器和镜像如何快速搭建一个企业级的应用,以及在容器服务 Serverless 版中,如何通过 Knative 部署满足企业级弹性需求的 Stable Diffusion 服务,同时通过对该服务进行压测实验,体验到了 ACK Serverless 的弹性能力。


相关阅读:基于容器平台 ACK 快速搭建 Stable Diffusion


关注公众号,后台回复:0105

免费获得上海站讲师 PPT 合辑


01 月 10 日 (周三)14:00-17:00,我们将在【阿里云云原生】视频号对本场活动进行线上直播回放,欢迎预约。


精彩回顾


下面就让我们一起回顾本次活动上都有哪些精彩瞬间,扫描下方金句海报二维码即可预约本场活动直播回放。


01 分享主题丨基于 Kubernetes 的云原生 AI 工程化落地实践


为了满足日益增长的算力需求、更高的业务稳定性要求,以及更快的创新和迭代交付,越来越多企业选择在云上开发、训练和部署 AI 模型,利用云计算的优势,获取稳定、弹性的大规模异构算力,从而提高算法迭代和应用落地的效率,并提升规模化服务的可靠性。活动现场,阿里云研发工程师徐之浩分享了云原生 AI 的发展背景和落地挑战,以及 ACK 云原生 AI 套件在智算时代的能力升级,包括 LLM/AIGC 的快速部署和加速推理,以及弹性分布式训练等最佳实践。



02 分享主题丨容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战


紧接着,阿里云技术专家刘佳旭围绕 K8s 集群稳定性的衡量标准和大规模场景下的挑战、ACK 针对这些挑战所做的稳定性治理和优化策略、以及 ACK 提供的稳定性产品功能和最佳实践三个方面,分享了基于 ACK 稳定性保障实践经验,帮助大家深入理解 ACK 稳定性理论和优化策略,以及如何使用相应的工具和服务进行稳定性保障。



03 分享主题丨如何应对大规模异构计算集群的运维和管理挑战?


面对大规模异构计算集群的运维和管理挑战的问题,阿里云研发工程师霍智鑫通过介绍异构计算集群运维难点、ACK GPU 集群的解决方案,为大家分享了 ACK 异构集群,对异构计算资源统一管理和调度,以及弹性伸缩、可观测,并提供共享 GPU 调度、GPU 拓扑感知调度等增强能力,提升资源使用效率。



04 分享主题丨业务容器化过程中,构建高性能云原生网关的实践


Higress Maintianer 范扬从 Higress 的发展历程开始,为大家分享了构建高性能云原生网关的最佳实践以及如何利用多集群流量调度能力实现同城容灾,同时带来了 Higress 标杆用户案例的分享,并在最后分享了 Higress 开源的未来规划。



05 分享主题丨构建安全、高效、弹性的 Serverless 混合云容器 AI 平台


以深度学习为代表的 AI 生产系统面临效率、性能和成本挑战,基于容器的AI/大数据成为云原生时代的技术趋势。在此次上海站活动现场,阿里云高级技术专家庄宇为大家分享了 IDC 自建容器 AI 平台,基于注册集群 + ECI 弹性上云以及如何通过 ACK One 实现多集群统一管理和业务部署,并通过 Fluid 实现混合云数据访问加速。



06  分享主题丨面向智算服务,构建可观测体系最佳实践


“可观测助力阿里云 AI 生态、大数据服务、容器服务构建无处不在的端到端可观测能力,同时可观测也借助生成式 AI、大模型等能力实现自身数据的深入洞察,实现互利双赢”。在活动最后的分享环节,阿里云技术专家郭雨杰为大家带来了构建面向 AI、大数据服务、容器服务的可观测体系思路与重点,以及阿里云可观测产品进展与布局,构建全栈可观测能力。



现场精彩瞬间


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4天前
|
存储 人工智能 数据管理
|
9天前
|
数据采集 人工智能 分布式计算
探索 MaxCompute MaxFrame:AI 数据预处理的高效之选
探索 MaxCompute MaxFrame:AI 数据预处理的高效之选
|
11天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
44 2
|
26天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
24天前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年11月】
大数据& AI 产品技术月刊【2024年11月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
25天前
|
SQL 运维 大数据
轻量级的大数据处理技术
现代大数据应用架构中,数据中心作为核心,连接数据源与应用,承担着数据处理与服务的重要角色。然而,随着数据量的激增,数据中心面临运维复杂、体系封闭及应用间耦合性高等挑战。为缓解这些问题,一种轻量级的解决方案——esProc SPL应运而生。esProc SPL通过集成性、开放性、高性能、数据路由和敏捷性等特性,有效解决了现有架构的不足,实现了灵活高效的数据处理,特别适用于应用端的前置计算,降低了整体成本和复杂度。
|
1月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
79 4
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI任务调度
PAI平台参加“周二开源日”活动,本期分享核心内容摘要 一、AI任务的需求与DLC 二、KubeDL 三、KubeDLPro 四、总结
1690 0
云原生场景中的 AI任务调度
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI 任务调度|学习笔记
快速学习云原生场景中的 AI 任务调度。
897 0
云原生场景中的 AI 任务调度|学习笔记
|
2天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
126 96