使用ACK Edge统一管理多地域的ECS资源

简介: 本文介绍如何使用ACK Edge来管理分布在多个地域的ECS资源。

【阅读原文】戳:使用ACK Edge统一管理多地域的ECS资源

ACK Edge面向分布式计算场景,在云端提供一个标准、安全、高可用的Kubernetes集群。支持将地域分散的计算资源接入云端Kubernetes集群,以云原生方式实现分布式计算场景下的应用统一生命周期管理和资源统一调度。同时,能够与云上现有的产品能力融合,保障分布式计算场景下应用的稳定运行。本文介绍如何使用ACK Edge来管理分布在多个地域的ECS资源。

 

 

 

 

场景描述

 

 

 

在多个VPC中都有ECS实例,希望用一个Kubernetes集群来统一管理这些ECS实例和应用;

 

在多个地域中都有ECS实例,希望用一个Kubernetes集群来统一管理这些ECS实例和应用;

 

在多个账号中都有ECS实例,希望用一个Kubernetes集群来统一管理这些ECS实例和应用。

 

 

 

 

方案优势

 

 

 

提供标准的云原生接口,采用云原生的方式运维分布式应用,降低业务的运维成本;

 

Kubernetes集群的控制面由阿里云托管,并提供SLA保障,用户无需运维Kubernetes集群;

 

与已有的云产品,包括弹性、网络、存储、可观测等能力融合,保障应用的稳定运行;

 

支持数十种不同操作系统的异构计算资源接入;

 

提供边缘自治、云边运维通道、单元化管理,支持中心管边场景下的运维、稳定性以及业务通信需求;

 

优化了云边通信流量,降低流量成本,单集群可纳管上千节点。

 

 

 

 

方案示例

 

 

 

示例一:使用ACK Edge管理地域分散的应用

 

 

当您有大量分散在不同地域的ECS需要统一管理或者部署相同的业务,您可以创建一个ACK Edge集群来统一接入不同地域的ECS,通过部署DaemonSet、或者OpenKruise DaemonSet来实现统一容器化管理。例如:

 

安全防护场景

 

在分布式计算环境中,为了防止系统被恶意攻击、数据泄露等问题,通常需要分布式资源上部署网络安全的Agent来为系统提供安全保障,可以使用ACK Edge完成安全Agent的统一部署和运维。

 

分布式压测、拨测场景

 

在大规模的业务压测场景中,压测工具从各个地域同时发起压测任务。因此,压测工具需要部署在地域分散的资源中,可以使用ACK Edge来纳管这些资源,快速地向不同地域部署压测工具。

 

缓存加速场景

 

分布式缓存加速服务,需要在各个地域部署缓存服务来加速网络内容的传输速度,采用ACK Edge可以实现对分布式缓存服务的统一部署和运维。

 

 

 

操作步骤

 

1. 环境准备

 

 

选择一个地域作为中心地域,创建ACK Edge集群

 

在组件管理中安装OpenKruise

 

为每个地域分别创建缘节点池, 并将ECS实例接入到对应的节点池中

 

 

2. 采用原生的DaemonSet模型管理业务

 

 

部署示例,在集群详情页面选择守护进程集,按需求选择命名空间以及部署方式,并按提示一步一步完成部署。

 

 

业务升级,同样在守护进程集页面,编辑DaemonSet的模版,实现业务版本及配置的升级。

 

 

 

3. 使用OpenKruise的DaemonSet部署业务

 

 

部署示例,在集群详情页面选择容器组,选择用yaml的方式部署,并选择模版自定义,将部署的yaml粘贴到编辑框中并提交。

 

 

业务升级, 在自定义工作负载页面,找到OpenKruise的DaemonSet,在要修改的工作负载后面编辑yaml即可实现业务版本及配置的升级。

 

 

 

示例二:单地域GPU资源不足时,可跨地域购买GPU实例扩容

 

当您在某个地域部署AI任务时,如果遇到了GPU资源不足的问题,您可以去其他地域购买需要的GPU实例,然后将对应的GPU实例接入到ACK Edge集群中,ACK Edge可以将任务调度到满足条件的实例上。

 

 

 

操作步骤

 

1. 准备环境

 

 

创建ACK Edge集群

部署训练或者推理任务

 

 

2. 集群所在地域GPU资源不足时,去其它地域购买GPU实例

 

 

部署yaml示例

 

apiVersion: apps/v1
kind: Deployment
metadata:
  name: tensorflow-mnist
  labels:
    app: tensorflow-mnist
spec:
  replicas: 1
  selector:
    matchLabels:
      app: tensorflow-mnist
  template:
    metadata:
      name: tensorflow-mnist
      labels:
        app: tensorflow-mnist
    spec:
      containers:
      - name: tensorflow-mnist
        image: registry.cn-beijing.aliyuncs.com/acs/tensorflow-mnist-sample:v1.5
        command:
        - python
        - tensorflow-sample-code/tfjob/docker/mnist/main.py
        - --max_steps=100000
        - --data_dir=tensorflow-sample-code/data
        resources:
          limits:
            nvidia.com/gpu: "1"
          requests:
            nvidia.com/gpu: "1"
        workingDir: /root

 

 

3. 新建边缘节点池,生成GPU实例接入脚本,将GPU实例接入该节点池。

 

 

4. 任务调度到新加入的GPU实例上

 

 

 

相关文档:

 

[1] 创建ACK Edge集群

https://help.aliyun.com/zh/ack/ack-edge/user-guide/create-an-ack-edge-cluster-1?spm=a2c4g.11186623.help-menu-85222.d_1_0_0.79b85e75UIWnHJ&scm=20140722.H_124723._.OR_help-T_cn~zh-V_1

 

[2] 创建和管理边缘节点池

https://help.aliyun.com/zh/ack/ack-edge/user-guide/edge-node-pool-management?spm=a2c4g.11186623.help-menu-85222.d_1_1_1.5f4484886zKHZx&scm=20140722.H_199462._.OR_help-T_cn~zh-V_1

 

[3] ACK Edge集群组件管理

https://help.aliyun.com/zh/ack/ack-edge/user-guide/component-overview?spm=a2c4g.11186623.help-menu-85222.d_1_3.576375a81t11zj&scm=20140722.H_2856040._.OR_help-T_cn~zh-V_1

 

[4] ACK Edge集群计费说明

https://help.aliyun.com/zh/ack/ack-edge/product-overview/billing-of-ack-edge-clusters?spm=a2c4g.11186623.help-menu-85222.d_0_2.129f1961BpAEz3&scm=20140722.H_178718._.OR_help-T_cn~zh-V_1

 

[5] OpenKruise DaemonSet

https://openkruise.io/zh/docs/user-manuals/advanceddaemonset/



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
弹性计算
阿里云服务器【地域】怎么选择划算一些?哪个地域好?
选择阿里云服务器地域时,优先考虑用户所在地区以实现就近访问。从划算角度看,部分地域如华北3(张家口)、华北6(乌兰察布)、华南2(河源)、华中1(武汉)常有优惠活动。此外,华北1(青岛)地域的公网带宽价格更具优势,适合对带宽成本敏感的用户。具体信息可查看阿里云ECS页面或官方文档了解最新优惠和选择建议。
|
24天前
|
存储 弹性计算 Linux
阿里云服务器地域、实例、带宽和镜像选择注意事项参考
阿里云服务器作为很多用户的首选云服务器产品,对于很多初次选购阿里云服务器的新手用户而言,在选购云服务器的过程中,面对地域、实例、带宽以及操作系统等配置选项,由于是初次选择,可能不知道应该如何选择以及选择过程中有哪些地方是需要注意的。为此,本文为新手用户介绍在选购阿里云服务器过程中,针对地域、实例、带宽和镜像的一些注意事项,以供参考。
|
25天前
|
弹性计算
阿里云服务器ECS计算型c9i实例2核4G配置租用费用整理(多地域报价)
阿里云ECS计算型c9i实例(2核4G)北京地域租用价:0.3873元/小时,185元/月,1450元/年,2877元3年。支持按小时、包月或包年计费,实际购买可享折扣,如1年7.1折,3年4.6折。具体价格以官网为准
81 1
|
2月前
|
前端开发
WebView2 控件(基于 Microsoft Edge (Chromium) 的嵌入式浏览器控件),保存资源(图片、脚本、CSS)
WebView2 控件(基于 Microsoft Edge (Chromium) 的嵌入式浏览器控件),保存资源(图片、脚本、CSS)
187 20
|
3月前
|
C# 图形学 开发者
Unity开发中使用UnityWebRequest从HTTP服务器下载资源。
总之,UnityWebRequest就是游戏开发者手中的万能钓鱼竿,既可以获取文本数据,也能钓上图片资源,甚至是那声音的涟漪。使用UnityWebRequest的时候,你需要精心准备,比如确定URL、配置请求类型和头信息;发起请求;巧妙处理钓获的数据;还需要机智面对网络波澜,处理各种可能出现的错误。按照这样的过程,数据的钓取将会是一次既轻松愉快也效率高效的编程钓鱼之旅。
177 18
|
5月前
|
缓存 人工智能 架构师
释放数据潜力:利用 MCP 资源让大模型读懂你的服务器
MCP(Model Control Protocol)资源系统是将服务器数据暴露给客户端的核心机制,支持文本和二进制两种类型资源。资源通过唯一URI标识,客户端可通过资源列表或模板发现资源,并使用`resources/read`接口读取内容。MCP还支持资源实时更新通知及订阅机制,确保动态数据的及时性。实现时需遵循最佳实践,如清晰命名、设置MIME类型和缓存策略,同时注重安全性,包括访问控制、路径清理和速率限制等。提供的示例代码展示了如何用JavaScript和Python实现资源支持。
672 80
|
6月前
|
存储 弹性计算 安全
阿里云服务器付费类型、地域、镜像、存储、带宽和安全组设置与选择注意事项参考
在我们通过自定义购买的方式购买阿里云服务器器ECS时,会有多个选项,有的新手用户可能并不是很清楚这些选项是什么,选择或设置时需要注意什么,本文将从付费类型、地域与可用区、镜像、存储、带宽和安全组等多个方面,为您详细解析云服务器购买过程中各个参数与配置的选择注意事项,以供参考。
405 66
|
5月前
|
人工智能 Serverless 调度
突破地域限制,实现算力无限供给 —阿里云ACK One注册集群开启多地域Serverless算力调度
本文介绍了阿里云ACK One注册集群多地域Serverless算力调度解决方案,解决传统数据中心在AI时代面临的算力不足问题。方案通过分钟级接入、100%兼容Kubernetes操作及云上Serverless弹性,实现跨地域弹性算力供给,支持高并发请求与模型快速迭代。文中详细描述了快速接入步骤、指定地域调度及动态调度方法,并提供了相关代码示例。该方案助力企业实现AI推理服务的规模化部署,提升商业落地效率。
|
5月前
|
人工智能 Serverless 调度
突破地域限制,实现算力无限供给 -- 阿里云ACK One注册集群开启多地域Serverless算力调度
传统单地域算力难以支撑AI推理场景的高并发实时响应、突发高流量的要求,阿里云容器服务ACK One注册集群推出多地域Serverless算力调度方案完美解决此问题。

热门文章

最新文章

推荐镜像

更多