活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 活动回顾丨云原生技术实践营上海站「云原生 AI &大数据」专场(附 PPT)

AI 势不可挡,“智算”赋能未来。2024 年 1 月 5 日,云原生技术实践营「云原生 AI &大数据」专场在上海落幕。活动聚焦容器、可观测、微服务产品技术领域,以云原生 AI 工程化落地为主要方向,希望帮助企业和开发者更快、更高效地落地云原生 AI 系统。


0105 云原生技术实践营-上海站 活动现场


此次活动吸引了金融科技、制造、汽车、健康医疗、在线旅游、新茶饮等领域的近百位开发者参与。活动现场,阿里云一线工程师围绕《基于 Kubernetes 的云原生 AI 工程化落地实践》、《容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战》、《如何应对大规模异构计算集群的运维和管理挑战?》、《业务容器化过程中,构建高性能云原生网关的实践》、《构建安全、高效、弹性的 Serverless 混合云容器 AI 平台》以及《面向智算服务,构建可观测体系最佳实践》6 个当下热门议题与现场的开发者、技术爱好者展开交流。


活动结尾,阿里云技术专家带领大家参与动手体验——基于容器搭建企业级应用、基于 ACK Serverless 轻松部署企业级 Stable Diffusion,让开发者们真正体验到基于容器和镜像如何快速搭建一个企业级的应用,以及在容器服务 Serverless 版中,如何通过 Knative 部署满足企业级弹性需求的 Stable Diffusion 服务,同时通过对该服务进行压测实验,体验到了 ACK Serverless 的弹性能力。


相关阅读:基于容器平台 ACK 快速搭建 Stable Diffusion


关注公众号,后台回复:0105

免费获得上海站讲师 PPT 合辑


01 月 10 日 (周三)14:00-17:00,我们将在【阿里云云原生】视频号对本场活动进行线上直播回放,欢迎预约。


精彩回顾


下面就让我们一起回顾本次活动上都有哪些精彩瞬间,扫描下方金句海报二维码即可预约本场活动直播回放。


01 分享主题丨基于 Kubernetes 的云原生 AI 工程化落地实践


为了满足日益增长的算力需求、更高的业务稳定性要求,以及更快的创新和迭代交付,越来越多企业选择在云上开发、训练和部署 AI 模型,利用云计算的优势,获取稳定、弹性的大规模异构算力,从而提高算法迭代和应用落地的效率,并提升规模化服务的可靠性。活动现场,阿里云研发工程师徐之浩分享了云原生 AI 的发展背景和落地挑战,以及 ACK 云原生 AI 套件在智算时代的能力升级,包括 LLM/AIGC 的快速部署和加速推理,以及弹性分布式训练等最佳实践。



02 分享主题丨容器服务 ACK 云上大规模 K8s 集群高可靠性保障实战


紧接着,阿里云技术专家刘佳旭围绕 K8s 集群稳定性的衡量标准和大规模场景下的挑战、ACK 针对这些挑战所做的稳定性治理和优化策略、以及 ACK 提供的稳定性产品功能和最佳实践三个方面,分享了基于 ACK 稳定性保障实践经验,帮助大家深入理解 ACK 稳定性理论和优化策略,以及如何使用相应的工具和服务进行稳定性保障。



03 分享主题丨如何应对大规模异构计算集群的运维和管理挑战?


面对大规模异构计算集群的运维和管理挑战的问题,阿里云研发工程师霍智鑫通过介绍异构计算集群运维难点、ACK GPU 集群的解决方案,为大家分享了 ACK 异构集群,对异构计算资源统一管理和调度,以及弹性伸缩、可观测,并提供共享 GPU 调度、GPU 拓扑感知调度等增强能力,提升资源使用效率。



04 分享主题丨业务容器化过程中,构建高性能云原生网关的实践


Higress Maintianer 范扬从 Higress 的发展历程开始,为大家分享了构建高性能云原生网关的最佳实践以及如何利用多集群流量调度能力实现同城容灾,同时带来了 Higress 标杆用户案例的分享,并在最后分享了 Higress 开源的未来规划。



05 分享主题丨构建安全、高效、弹性的 Serverless 混合云容器 AI 平台


以深度学习为代表的 AI 生产系统面临效率、性能和成本挑战,基于容器的AI/大数据成为云原生时代的技术趋势。在此次上海站活动现场,阿里云高级技术专家庄宇为大家分享了 IDC 自建容器 AI 平台,基于注册集群 + ECI 弹性上云以及如何通过 ACK One 实现多集群统一管理和业务部署,并通过 Fluid 实现混合云数据访问加速。



06  分享主题丨面向智算服务,构建可观测体系最佳实践


“可观测助力阿里云 AI 生态、大数据服务、容器服务构建无处不在的端到端可观测能力,同时可观测也借助生成式 AI、大模型等能力实现自身数据的深入洞察,实现互利双赢”。在活动最后的分享环节,阿里云技术专家郭雨杰为大家带来了构建面向 AI、大数据服务、容器服务的可观测体系思路与重点,以及阿里云可观测产品进展与布局,构建全栈可观测能力。



现场精彩瞬间


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
19小时前
|
人工智能 自然语言处理 算法
AI技术对开发者的职业天花板是提升还是降低?
AI技术对开发者的影响复杂多面,既提升也降低了职业天花板。一方面,AI提高开发效率,自动化重复工作,扩展了应用领域,促使开发者持续学习新技能。另一方面,它带来职业转型压力,技能可能过时,竞争加剧。开发者应持续学习,跨领域发展,培养创新思维,以适应和利用AI技术提升自身职业发展空间。
6 0
|
1天前
|
机器学习/深度学习 人工智能 分布式计算
构建基于AI的游戏AI系统:技术详解与实现
【6月更文挑战第4天】本文探讨了构建基于AI的游戏AI系统的详细过程,包括技术选型(如机器学习、深度学习、强化学习)、系统设计(感知层、决策层和执行层)、实现步骤(数据收集、模型训练、评估与优化)和优化策略(实时更新、多代理协同、迁移学习、持续学习)。通过合理选择技术和策略,可以创建高性能、适应性强的游戏AI系统,提升游戏体验并推动创新。
|
1天前
|
人工智能 Cloud Native 持续交付
云端之翼:探索云原生技术的无限可能
【6月更文挑战第3天】随着企业数字化转型的深入,云原生技术如同一股不可阻挡的潮流,正在重塑我们的开发和运维模式。本文将带您深入了解云原生的核心概念,探讨其如何促进应用的敏捷性、可扩展性和可靠性,并展望这一技术趋势如何继续影响未来的技术生态。
|
2天前
|
Cloud Native 容器 微服务
云原生技术的融合与创新:构建未来应用的基石
本文深入探讨了云原生技术如何成为现代软件开发的核心,分析了其对传统IT架构的影响及带来的变革。我们将通过具体案例,展示云原生如何助力企业快速迭代和部署应用,同时讨论了在采纳云原生过程中面临的挑战与解决方案。
|
2天前
|
语音技术 人工智能 机器学习/深度学习
构建基于AI的语音合成系统:技术探索与实践
【6月更文挑战第3天】本文探讨了构建基于AI的语音合成系统,包括文本预处理、声学模型、语音生成和后期处理四个步骤。关键技术和挑战涉及分词、词性标注、语调预测、HMM、DNN、RNN模型、波形合成及后期音质优化。实践中,获取高质量语音数据、训练计算资源和系统实时性是主要挑战。随着技术进步,未来语音合成将在多语种、个性化领域有更多应用。
|
3天前
|
人工智能 搜索推荐 数据处理
如何利用AI技术提高教育评估的效率和准确性?
【6月更文挑战第2天】如何利用AI技术提高教育评估的效率和准确性?
108 59
|
7天前
|
存储 弹性计算 监控
【阿里云云原生专栏】成本优化策略:在阿里云云原生平台上实现资源高效利用
【5月更文挑战第29天】本文探讨了在阿里云云原生平台上实现资源高效利用和成本优化的策略。通过资源监控与评估,利用CloudMonitor和Prometheus等工具分析CPU、内存等使用情况,识别浪费。实施弹性伸缩策略,利用自动伸缩规则根据业务负载动态调整资源。借助容器化管理和Kubernetes编排提高资源利用率,优化存储选择如OSS、NAS,以及网络配置如VPC和CDN。示例展示了如何使用Kubernetes的HorizontalPodAutoscaler进行弹性伸缩,降低成本。
40 4
|
7天前
|
边缘计算 Cloud Native 数据管理
【阿里云云原生专栏】云原生背景下的AIoT布局:阿里云Link平台解析
【5月更文挑战第29天】阿里云Link平台,作为阿里云在AIoT领域的核心战略,借助云原生技术,为开发者打造一站式物联网服务平台。平台支持多协议设备接入与标准化管理,提供高效数据存储、分析及可视化,集成边缘计算实现低延时智能分析。通过实例代码展示,平台简化设备接入,助力智能家居等领域的创新应用,赋能开发者构建智能生态系统。
42 3
|
7天前
|
存储 Kubernetes Cloud Native
【阿里云云原生专栏】云原生容器存储:阿里云CSI与EBS的高效配合策略
【5月更文挑战第29天】阿里云提供云原生容器存储接口(CSI)和弹性块存储(EBS)解决方案,以应对云原生环境中的数据存储挑战。CSI作为Kubernetes的标准接口简化存储管理,而EBS则提供高性能、高可靠性的块存储服务。二者协同实现动态供应、弹性伸缩及数据备份恢复。示例代码展示了在Kubernetes中使用CSI和EBS创建存储卷的过程。
51 3