2022云栖精选—中国移动算力网络云原生虚拟化技术

简介: 魏宝辉中国移动信息技术技术中心PaaS架构师

lQLPJxbcF2cqNBvMiM0FeLCMz4ifcSGHeANpqgFLAEAA_1400_136.pngimage.png

从算力网络的建设背景上来说,我们国家在 2020、2021 以及 2022 年密集出台多项了相关政策规划规划,比如数据中心、东数西算以及工信部的数据中心发展规划等。建设算力网络既是国家总体规划,它也是产业发展的需要,当下各当前企业都在进行面临产业数字化转型加速,对信息基础设施的实时供给提出了更高需求。建设算力网络也符合中国移动战略转型的需要要求。

image.png

算力网络的总体规划主要是面向国家产业数字化的升级,构建新型的基础设施。算力网络是以算为中心,以网为根基,网、云、数、智、安、边、端、链  (ABCDNETS)  深度融合的新型信息基础设施。实现“算力泛在、 算网共生、智能编排、 一体服务”的目标。算网共生强调从网随算动、算网融合,到算网一体。网络从支持灵活、随需、敏捷的算力连接,到感知算力、承载算力,实现网在算中、算在网中。


算力泛在指构建云边端多层次、立体泛在的分布式算力,实现三融通。空间上,融通东西,实现4 +3 +X 数据中心布局;逻辑上,实现融通云 ( C) 、边 ( E) 、端 (T);内核实现融通异构,实现ARM/x86/ASIC等多样性算力。


智能编排指融数注智,构建算网大脑,实现算网统一编排、调度、管理、运维,打造算网资源智能规划、灵活调度、高效优化的核心能力。


想要实现以上要求,需要逐步推动算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“算力无处不在、网络无所不达、智能无所不及”的愿景。还要实现多要素算力的融合供给、社会算力的并网融合以及数智服务的融合供给,让用户感觉到算力无处不在,网络无所不达,提供智简的使用模式。

1.png

算力的开发过程中会面临很多问题。比如有各种各样异构的资源、在不同地域部署了不同服务。在算力网络的开发过程中会调用到不同的能力,而能力又分散在各个不同的地方,使用方式也不尽相同,尤其是在云原生时代,微服务开发模式下,往往需要多人协作,甚至多团队协作,那么对开发环境提出了较高的要求,不同的模块都需要有开发测试准生产等多套环境,那么如何在相对有限的算力上更高效的供给k8s环境成为一个难题。


开发人员使用本地笔记本电脑开发时,笔记本承载k8s环境相对较重,有一定的负载,会影响开发效率。服务器算力更强性能更好,但是却难以提供每人一套k8s环境。


为解决这个问题,我们利用云原生、基于算力虚拟化技术打造了磐基磐舟一体化开发环境。提供云原生的虚拟化集群,在物理硬件上提供多套虚拟化k8s集群,有了开发集群才能做基于云原生的算力网络改造以及应用。


在传统集群模式下,比如9个节点一般能创建2-3个集群,只能满足2-3个小的团队使用,而实际的开发团队数量会更多。在云原生虚拟化模式下,,能够实现9个节点170个集群左右的供给。集群均为虚拟化的集群,互相之间独立且隔离,不同的开发团队可以使用不同的集群,甚至每一个开发都可以申请多个集群,有效解决云原生算力开发过程中碰到的开发环境、测试环境不够用问题。


技术上,我们使用了gitops等云原生的技术,结合kubevirt、kind等技术栈,融合了k8s的 ClusterAPI 实现了集群资源的自动化供给,同时兼容ARM和X86 两种异构的硬件资源。

image.png

为了解决本地调试、云原生调试、微服务调试之间的联调需求,我们将集群环境与云 IDE做了关联,将云IDE设置为类似于小的开发笔记本,用户可以拥有多个云IDE,而且云IDE可以部署到多个集群之中,也可以多个用户的云IDE部署到同一个集群,云IDE之间能够连成小的局域网,用户可以方便地进行联调,另外用户可以根据自己的使用习惯保存配置。


用户也可以从本地直接连到远端的开发集群,云IDE可以与远端、本地做联调,解决了用户在联调中本地无法连接远端集群内的中间件、应用的问题。

image.png

在安全上使用了多层的安全防护,虚拟化的集群相当于在POD内设置了虚拟化,虚拟化上又进行了集群的安装,实现了k8s in pod。那么我们可以基于 K8S 做POD级的出入双向白名单控制。采用了云原生虚拟化以后本质上内核已经做了隔离,集群之间与物理机之间也都得到了较好的隔离。在用户开发调试的访问上可以采用统一的开发网关,实现统一的访问控制。


云IDE会按用户隔离,一个用户可以有多个云IDE,多个云IDE可以多个部署到多个集群,实例之间互相隔离且为容器化。


通过集群级、访问级、底层物理机级几层的访问控制以后,隔离上的安全能够得到比较充分的保障。

image.png

本产品支撑了2022年中国移动云原生开发大赛,使用了9台服务器,为130支参赛队伍,累计交付集群990+个,同时活跃集群高达175个。提供云IDE小电脑397个,用户自助操作内置开发套件服务1799次,用户自助部署并暴露980+服务,开发调试访问超过1.5亿次。但是在平台支撑仅投入3个开发,1个兼职运营,无专职运维人员。得益于技术演进,基本实现了平台自助化操作、无人值守自动化运行,用户随用随申请,完全自服务,用完自动回收。


本次提供云原生虚拟化服务的资源池分布在两个不同的地域,平台可以做两个地域之间的用户负载。因此,通过该模式能够实现算力的分布式布局,帮助用户解决了算力使用、开发问题,也为后续算力网络的推广应用打下了良好的技术基础。


关于龙蜥峰会云原生专场课件获取方式:


【PPT 课件获取】:关注微信公众号(OpenAnolis),回复“龙蜥课件” 即可获取。有任何疑问请随时咨询龙蜥助手—小龙(微信:openanolis_assis)。


【视频回放】:视频回放可前往龙蜥官网https://openanolis.cn/video 查看。

lQLPJxbcF2cqM2TM-M0CnrCgW_7LDpyh1wNpqgFKAPsA_670_248.png

相关实践学习
CentOS 7迁移Anolis OS 7
龙蜥操作系统Anolis OS的体验。Anolis OS 7生态上和依赖管理上保持跟CentOS 7.x兼容,一键式迁移脚本centos2anolis.py。本文为您介绍如何通过AOMS迁移工具实现CentOS 7.x到Anolis OS 7的迁移。
相关文章
|
30天前
|
Kubernetes Cloud Native 微服务
探索云原生技术:容器化与微服务架构的融合之旅
本文将带领读者深入了解云原生技术的核心概念,特别是容器化和微服务架构如何相辅相成,共同构建现代软件系统。我们将通过实际代码示例,探讨如何在云平台上部署和管理微服务,以及如何使用容器编排工具来自动化这一过程。文章旨在为开发者和技术决策者提供实用的指导,帮助他们在云原生时代中更好地设计、部署和维护应用。
|
30天前
|
Cloud Native 持续交付 开发者
云原生技术在现代企业中的应用与实践####
本文深入探讨了云原生技术的核心概念及其在现代企业IT架构转型中的关键作用,通过具体案例分析展示了云原生如何促进企业的敏捷开发、高效运维及成本优化。不同于传统摘要仅概述内容,本部分旨在激发读者对云原生领域的兴趣,强调其在加速数字化转型过程中的不可或缺性,为后续详细论述奠定基础。 ####
|
5天前
|
运维 Cloud Native Serverless
Serverless Argo Workflows大规模计算工作流平台荣获信通院“云原生技术创新标杆案例”
2024年12月24日,阿里云Serverless Argo Workflows大规模计算工作流平台荣获由中国信息通信研究院颁发的「云原生技术创新案例」奖。
|
3天前
|
负载均衡 容灾 Cloud Native
云原生应用网关进阶:阿里云网络ALB Ingress 全能增强
在过去半年,ALB Ingress Controller推出了多项高级特性,包括支持AScript自定义脚本、慢启动、连接优雅中断等功能,增强了产品的灵活性和用户体验。此外,还推出了ingress2Albconfig工具,方便用户从Nginx Ingress迁移到ALB Ingress,以及通过Webhook服务实现更智能的配置校验,减少错误配置带来的影响。在容灾部署方面,支持了多集群网关,提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。
34 4
|
5天前
|
人工智能 Cloud Native 大数据
DataWorks深度技术解读:构建开放的云原生数据开发平台
Dateworks是一款阿里云推出的云原生数据处理产品,旨在解决数据治理和数仓管理中的挑战。它强调数据的准确性与一致性,确保商业决策的有效性。然而,严格的治理模式限制了开发者的灵活性,尤其是在面对多模态数据和AI应用时。为应对这些挑战,Dateworks进行了重大革新,包括云原生化、开放性增强及面向开发者的改进。通过Kubernetes作为资源底座,Dateworks实现了更灵活的任务调度和容器化支持,连接更多云产品,并提供开源Flowspec和Open API,提升用户体验。
|
19天前
|
Cloud Native
邀您参加云原生高可用技术沙龙丨云上高可用体系构建:从理论到实践
云原生高可用技术专场,邀您从理论到实践一起交流,探索云上高可用体系构建!
|
1月前
|
Cloud Native 持续交付 云计算
云原生技术的崛起与未来展望
本文探讨了云原生技术的核心概念、发展历程及其在现代IT架构中的关键作用。随着云计算的普及,云原生作为一种优化云应用构建和部署的方法,正逐渐成为企业数字化转型的重要推力。文章分析了容器化、微服务、持续集成/持续部署(CI/CD)等关键技术如何支撑起灵活、高效、可扩展的云原生架构,并讨论了面临的挑战与未来的发展趋势。
59 12
|
2天前
|
编解码 弹性计算 大数据
软硬结合助力倚天云原生算力再进化,加速大数据、视频转码上云步伐
本文介绍了云原生算力的进化,重点讨论了倚天710 CPU在大数据和视频转码场景中的应用与优势。倚天710采用ARM架构,通过物理核设计和CIPU加速卡优化,显著提升了高负载下的性能稳定性,并在实际应用中帮助客户实现了20%-40%的性能提升和成本降低。此外,文章还探讨了操作系统、编译器等底层软件的优化,以及如何通过龙蜥社区和阿里云平台支持更多应用场景,助力企业实现高效迁移和性能优化。
|
30天前
|
Cloud Native JavaScript Docker
云原生技术:构建现代应用的基石
在数字化转型的浪潮中,云原生技术如同一艘承载梦想的航船,引领企业驶向创新与效率的新海域。本文将深入探索云原生技术的核心价值,揭示其如何重塑软件开发、部署和运维模式,同时通过一个简易代码示例,展现云原生应用的构建过程,让读者领略到云原生技术的魅力所在。
|
30天前
|
运维 Cloud Native 持续交付
云原生技术深度探索:重塑现代IT架构的无形之力####
本文深入剖析了云原生技术的核心概念、关键技术组件及其对现代IT架构变革的深远影响。通过实例解析,揭示云原生如何促进企业实现敏捷开发、弹性伸缩与成本优化,为数字化转型提供强有力的技术支撑。不同于传统综述,本摘要直接聚焦于云原生技术的价值本质,旨在为读者构建一个宏观且具体的技术蓝图。 ####

热门文章

最新文章