阿里云基础设施高可用最佳实践沙龙深圳站圆满举办!

简介: 2024年11月28日,阿里云在深圳东海朗廷酒店举办了“构建云上高可用数据中心:从原子能力到场景架构的实战之旅”高可用最佳实践沙龙。活动邀请了多位阿里云专家,分享了高可用数据中心的构建方法、应用场景及最佳实践,吸引了众多企业CTO、架构师和技术从业者参与。通过互动交流,与会者深入了解了阿里云的高可用解决方案,并期待未来合作。

376A3454-opq3336862274.jpg

2024年11月28日,阿里云基础设施高可用最佳实践沙龙NO.1:《构建云上高可用数据中心:从原子能力到场景架构的实战之旅》深圳东海朗廷酒店顺利举行。活动现场,来自阿里云计算、存储、网络、云原生的专家们分享了高可用的基础知识与分级,阿里云产品的原子能力以及面向不同场景的云端高可用架构最佳实践等丰富的内容。吸引了来自华南地区的数十家企业CTO、架构师、技术从业者到场,现场近距离与阿里云专家探讨交流业务问题和技术发展。

邱经忠.jpg 在沙龙上,阿里云华南大区企业解决方案总监邱经忠发表了开场致辞,热情欢迎大家的到场,同时分享了对当前行业发展趋势的见解和阿里云在推动企业构建云上高可用数据中心方面的积极探索与成果,鼓励与会者积极交流,共同探讨未来的合作机会。

376A2799-opq3336222100.jpg

阿里云智能高级产品专家李媛分享了企业建设高可用能力的必要性与架构分级》,为了保证业务的连续性,应对各种意外的发生,企业需要加强IT架构高可用能力的建设。同时,高可用架构分为数据备份容灾、故障切换、应用双活等多个等级,不同的等级也对应不同的 RPO / RTO 及成本,企业应该根据自身的业务或合规需求进行选择。

接着是《面向不同场景的阿里云高可用设计方案》的主题分享,阿里云智能云网络高级解决方案架构师潘志新、阿里云智能弹性计算解决方案架构师储依帆、阿里云智能高级产品专家李媛、阿里云智能存储解决方案架构师王太平这四位专家为我们进行了不同层面的技术分享。

储依帆.jpg

阿里云智能弹性计算解决方案架构师储依帆介绍了企业级应用架构高可用设计的六个关键要素,涵盖云上集群管控、工作负载平面等。他详细阐述了阿里云在虚拟机和容器环境的高可用方案能力。在虚拟机环境中,结合全量和增量快照、多版本和备份恢复能力,实现了多AZ、多地域的高可用设计。在容器环境中,介绍了ACK的控制面组件,包括跨可用区部署的etcd和API Server的高可用设计。此外,结合ACK One与ALB/MSE Ingress,实现ACK单域的故障隔离和跨集群应用的快速恢复,完成跨地域多集群的云上高可用架构 ;ACK备份中心在多云/混合云环境下,支持K8s集群的快速备份与恢复。

李媛.jpg

阿里云智能高级产品专家李媛还为大家带来了企业灾备管理服务-数据灾备中心和阿里云统一灾备平台-云备份两款产品方案的讲解。针对企业的混合云或者公共云环境,云备份提供策略化备份归档上云、云上备份容灾等全方位能力,同时一系列企业级能力如跨账号备份、不可变备份、备份点病毒检测、自动归档等可以帮助企业搭建更易用、合规、降本增效的备份架构。数据灾备中心覆盖了多种IAAS层和SAAS化数据灾备方案,通过可视化界面、资源分类管理、集中化保护策略等方式助力企业更好地完善和规划阿里云上的数据保护架构。

潘志新.jpg

基础不牢,地动山摇。阿里智能云网络高级解决方案架构师潘志新在现场跟大家分享了云网络作为用户云上业务的底层基础设施.整个云网络的设计和规划,直接决定了网络基础设施能否给业务提供各种场景下的容灾和弹性能力。云上网络在最基础的VPC设计层面,就需要考虑到AZ的设计,在不同的AZ都能够同时提供网络接入和服务能力。网元产品上,如负载均衡NLB/ALB,支持同时在多个可用区绑定公网EIP,为该region的业务提供冗余可靠的公网及内网服务能力。内网产品上,云企业网提供了全球互联网的组网能力,其部署的overlay快速重路由黑科技zooroute,能够让云企业网有一张底层全路径质量的全局视图,当物理层的设备和线路发生故障无法自行收敛恢复,需要人工介入,zooroute会在overlay层面标记出这些路径,然后在实际流量转发过程中规避有问题的路径,从而帮助用户实现99.995%的云网络高可靠性。

王太平.jpg

阿里云智能存储解决方案架构师王太平介绍了ESSD同城冗余云盘(regional ESSD),该云盘可以在多个可用区存储数据,实现高可用性和业务连续性,确保在物理故障时数据不丢失。相较于传统主备复制方案,ESSD的部署方式消除了复制延迟和数据不一致的问题,且具有零改造成本的优势,能够帮助有状态应用轻松实现可用区级容灾能力。在互联网媒体娱乐行业,阿里云提供高可用的源站建设方案,特别是针对跨地域高可用存储需求,如视频点播客户,通过OSS的跨区域复制和传输加速来构建多活源站。最后,针对大型全球化企业的灾备需求,阿里云的OSS方案结合了跨区域复制、传输加速、存储和镜像回源,能支持全球范围内的数据持续复制和多读多写,满足跨境数据需求。

卢萌凯.jpg

近年来,企业用户对系统稳定性的关注不断增加,尽管新技术层出不穷,重大故障依然屡见不鲜,且影响显著。阿里云智能云原生高级解决方案架构师卢萌凯分享了《云原生弹性高可用设计实践》,从四个方面探讨了如何提升系统稳定性和业务连续性:首先,介绍阿里巴巴利用技术手段和管理措施实现容错、容量和容灾以构建稳健的生产环境;其次,分享考虑故障场景的架构设计最佳实践;然后,讨论有效容量管理的设计与实践方案,以保障高峰期系统稳定;最后,探讨实现同城和异地多活的高可用设计。


茶歇过后,大家迎来了热烈的互动讨论环节。在此环节中,与会者围绕沙龙提出的话题,结合各自的业务场景,展开了深入且激烈的讨论。现场的客户代表踊跃发言,积极分享他们在技术应用中的思考与实践,进一步丰富了讨论的深度与广度。各小组的专家积极响应,给出了建设性的反馈和建议,促进了各方的思维碰撞与知识共享,推动了整个讨论的热烈气氛与成果的落地实施。通过这样的互动交流,大家不仅深化了对技术的理解,也为今后的合作奠定了更加坚实的基础。




活动结束后,来宾们领取了结业证书和伴手礼。通过这次活动,大家不仅对建设高可用能力的重要性有了深度了解,也学习了企业应该如何在阿里云上搭建高可用架构。基于公共云的弹性能力,很多本地机房难以解决的挑战都可以在云上找到更简单、更具性价比的解法。大家都十分期待参加下一次的沙龙活动,也将在未来企业IT架构的运维中,学以致用,让业务更连续。

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
6月前
|
存储 人工智能 安全
【阿里云基础设施 AI Tech Day】 AI Infra 建设方案及最佳实践沙龙圆
聚焦 AI Infra 建设方案及最佳实践,「智驱未来,云网随行:AI Infra 建设方案及最佳实践」沙龙阿里云基础设施 AI Tech Day 北京站于 8 月 8 日下午在北京全球创新社区顺利举办,活动现场吸引了来自月之暗面、字节、小米、爱奇艺、360、雪球、猿辅导、奥迪等 16 家相关 AI 领域领先企业或有AI建设诉求企业的 32 名业务/技术骨干参与。本次技术沙龙旨在聚焦企业建设高效、高可用的 AI Infra,深入解析 AI 驱动的原子能力与场景化架构设计,分享从基础网络建设、算力池化、存储调度,以及 VPC RDMA 性能优化、Agent 智能体出海等场景的全链路方案,助力企业
548 1
|
Kubernetes Cloud Native Java
Activiti 简介以及最新activiti依赖 pom.xml文件(使用时注意对应版本号)
Activiti 简介以及最新activiti依赖 pom.xml文件(使用时注意对应版本号)
967 2
|
7月前
|
人工智能 安全 调度
线上观看人次近 2 万,龙蜥社区走进中兴通讯 MeetUp 圆满结束
近 50 位技术专家共同探讨了 AI 在系统领域的应用和挑战,为 AI 时代国产操作系统的核心竞争力塑造贡献力量。
|
4月前
|
人工智能 算法 架构师
AI时代程序员的生存与突围从需求分析开始
AI能3秒生成代码框架,还要程序员干什么?
683 9
|
4月前
|
人工智能 供应链 数据挖掘
智能体来了+智能体成企业转型新引擎,阿里云助力产业迈向智能化未来
智能体正成为企业转型新引擎,阿里云引领产业智能化。通过融合大模型与企业场景,智能体已实现降本增效、自动化办公、精准决策,广泛应用于制造、服务、零售等领域。2024年被视为“智能体应用元年”,阿里云推动技术普惠,助力企业AI转型,培育开发人才,开启智能经济新时代。(238字)
360 2
|
缓存 NoSQL 调度
Tair:基于KV缓存的推理加速服务
Tair 是阿里云基于KV缓存的推理加速服务,旨在优化大模型推理过程中的性能与资源利用。内容分为三部分:首先介绍大模型推理服务面临的挑战,如性能优化和服务化需求;其次讲解Nvidia TensorRT-LLM推理加速库的特点,包括高性能、功能丰富和开箱即用;最后重点介绍基于KVCache优化的推理加速服务,通过Tair的KV缓存技术提升推理效率,特别是在处理长上下文和多人对话场景中表现出色。整体方案结合了硬件加速与软件优化,实现了显著的性能提升和成本降低。
1205 3
|
11月前
|
存储 人工智能 云栖大会
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
|
存储 人工智能 文件存储
阿里云吴结生:面向大规模数据智能的阿里云存储创新
近年来,越来越多人意识到,我们正处在一个数据爆炸式增长的时代。IDC 预测 2027 年全球产生的数据量将达到 291 ZB,与 2022 年相比,增长了近 2 倍。其中 75% 的数据来自企业,每一个现代化的企业都是一家数据公司。
1516 10
阿里云吴结生:面向大规模数据智能的阿里云存储创新