云后端技术管理体系架构的十项修炼

简介:

在云计算产品迭代的时候,提供给用户的操作界面是可以参考当前的主流思想进行对比和设计的,但是作为不暴露给用户的云管理端技术体系该如何构建,这是一个比较复杂的问题。

360安全云产品和技术团队结合公司私有云体系的相关经验,已经着手设计并形成了完整的云后端技术管理体系架构,在本文中将与大家分享。

在云计算技术体系架构中,后端技术管理提供IaaS、PaaS、SaaS三层资源的全生命周期管理工作,不但需要实现物理资源和虚拟资源的统一管 理,更为重要的是,还需要提供资源管理、统计、监控调度、服务监控等端到端的综合管控能力。在这种场景下,产品设计必然会和公司内部的传统运维模式产生差异。

修炼之一:数据集中化

为了避免出现传统系统各个层面数据各自为政的情况,云计算中需要将机房信息、网络信息、主机信息、虚拟资源信息、产品业务信息、功能逻辑信息等各种信息统一用一套信息管理系统进行整理,并提供标准的接口和权限识别能力,并允许其他系统间的相互调用。

修炼之二:资源池化

云计算体系下所有的原始资源,如机器、存储、网络等需要做到可标识、无状态,并将同类体系的资源全部通过资源池进行管控;对申请的新资源在资源池内进行合理的规划分配,保证资源的利用率;对释放的资源进行垃圾回收,并定期对资源池内资源分布进行定期的归并收敛操作。

修炼之三:自动化

在云计算层面的管理和运维,需要收集、索引和分析各个云资源的基础数据,并对系统进行容量、性能、稳定性等方面的预测。这些操作需要功能强大的数据收集、传输、处理、分析和展示工具,并能够在短时间内将系统的状态进行汇总和告警。

整个告警系统除了针对配置、性能和状态三个维度采集信息并分析告警外,云计算的运维自动化还包括持续不断的基于云基础设施开发和维护各种自动化运维 工具。比如配置管理工具用来设置参数或者开启一个新服务器上的服务;命令执行工具可以让管理员在紧急情况下不受各种体系的制约地对各类服务器执行操作;服 务器自动构建工具可以加速部署速度,并可以在短时间内大规模部署服务器,同时也可以让构建过程更容易复制,并且在发生严重故障时,还可以重建架构。

修炼之四:流程化

云计算下的管理和运维比传统方式要复杂许多,需要新的流程化技术方案以提高管理效率,降低系统资源投入。

360云在运维架构设计上除了引入了ITIL的技术框架外,还结合当前公司的运维体系,针对事故管理、问题管理、配置管理、变更管理、可用性管理、 能力管理、服务水平管理、例常报告、定期巡检、用户反馈等十几种管理需求设计了丰富且有效的技术方案,使整个流程能够快速有效地运转。

修炼之五:个性化

云计算的管理除了适配当前的技术方案外,还需要不断适应当前新技术和新用户的需求。为了能够快速适应变化,除了适配当前的主流运维体系,360还创 新地使用一些新技术、新理念,不断地孵化新的运维工具和运维方式。有些工具和技术方案已经开源,并在开源领域有了一定的影响力,它有效地降低了云计算的门 槛,正在帮助越来越多的小型开发团队涉足云计算领域。

例如我们开发了功能完善的后台管理门户系统,该系统不但支撑基础设施资源、平台资源和应用资源以服务的方式交互给用户,还提供基础设施资源、平台资 源和应用资源服务的定价、检索、资源使用情况统计等自服务功能,而且还可以根据不同的用户需要提供不同的展示,并有效隔离多用户的数据。

修炼之六:权限与用户管理

权限本身是为了提供数据存取方面的安全控制,这在云计算中尤为重要。我们在云管理系统中会提供身份访问管理能力,只有授权的用户才能访问相应的功能和数据,未授权的用户在使用之前必须对资源服务提出使用申请,经批准后才能正确使用。

除此之外,还收集、储存并实时更新的用户的信息,状态,等级等内容,并在此基础上完成工单、销售、客服等支持功能,后续还可以融入需求分析和智能推荐等高级功能。

修炼之七:产品与服务管理

云管理端还需要建设完善的产品与服务管理体系。产品与服务管理定义了云平台提供的基础设施资源的名称,定价以及前端的套餐等,除此之外,还需要定义 云服务的名称、基本信息、服务区域、配额和权限,并提供云服务信息的注册、配置、发布、注销、变更、查询等管理功能供用户使用。

服务质量管理则需要遵循SLA要求,主动按期审核和管理资源的实际使用情况,针对未达到预先约定的SLA要求,自动化地进行资源调配,并对产品功能进行迭代演进,以满足SLA的要求。

修炼之八:调度管理

调度管理是云计算中重要一环,服务调度是其中之一。360云服务调度系统基于各个云服务的特点,接受上层的请求,进行资源的调度、运行顺序逻辑的管理,并进行展示和存储。

资源调度是云计算调度体系里的另一环,通过查询基础资源和服务资源,判断当前资源状态,提供不同种类资源的合理分配算法,并配合调度系统来分配、部 署资源,实现实时响应服务请求,并根据需求实现云服务的自动化生成、分配、回收、迁移、数据收敛等工作,用以支持云计算的资源弹性特性。

修炼之九:安全运维管理

一个稳定的云平台,必须具备健康状态的自我感知能力。这部分360采用了内部一套自研的安全运维系统,负责对底层资源和对外提供服务的上层资源进行 分别的监控管理。对外提供服务的监控管理通过自定义插件形式实现,能够进行实时监控、捕获资源部署状态,获得使用和运行指标、各类告警信息并按自定义的逻 辑发送给对应的人或组。通过安全运维系统,可以实时保障云平台的高可用性,给用户提供不间断的云服务。

而资产统计巡检则按照资源的实际使用情况进行统计和分析,每天按照报表的形式通过云统计功能的维度进行资源的汇总和告警。

修炼之十:财务管理

如果提供一个成熟的公有云平台,那么一个完善的财务系统是必不可少的,其中重要部分是订单和计费系统。360会按照当前的业务模型和产品逻辑,记录 用户的购买历史,在计费方式上实现包年、包月、按量计费的收费模型。在业务逻辑上能够实现单产品代金券、多产品通用代金券等扩展功能;在用户逻辑上能够实 现获取用户等级并进行相应的扣费。

除了计费,还需要支持账单管理。需要系统能够针对用户的充值、发票,消费账单等进行记录,能够从多维度查找信息并支持后台的灵活操作,能够定期与公司的财务系统进行对账和结算。

后记

上述云后端管理系统虽然从功能架构上看非常复杂,但是作为一套完整的公有云体系则又是必须的功能,因此需要产品、前端、服务端、后端开发和运维等团 队进行跨部门协作,同时还需要有一个完整的QA体系来保证每一部分的质量,这本身就是一件极具挑战的事情,360云团队会用心为用户打造一个安全云平台。


本文作者:佚名

来源:51CTO


相关文章
|
30天前
|
存储 缓存 安全
某鱼电商接口架构深度剖析:从稳定性到高性能的技术密码
某鱼电商接口架构揭秘:分层解耦、安全加固、性能优化三维设计,实现200ms内响应、故障率低于0.1%。详解三层架构、多引擎存储、异步发布、WebSocket通信与全链路防护,助力开发者突破电商接口“三难”困境。
|
2月前
|
消息中间件 JavaScript 前端开发
如何开发ERP(离散制造-MTO)系统中的技术管理板块(附架构图+流程图+代码参考)
本文详解ERP(离散制造-MTO)系统中的技术管理板块,涵盖产品定义、BOM、工序、工艺文件及变更控制的结构化与系统化管理。内容包括技术管理的核心目标、总体架构、关键组件、业务流程、开发技巧与最佳实践,并提供完整的参考代码,助力企业将技术数据转化为可执行的生产指令,提升制造效率与质量。
|
1月前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
|
2月前
|
数据采集 监控 JavaScript
移动端性能监控探索:鸿蒙 NEXT 探针架构与技术实现
阿里云 ARMS 团队倾力打造的鸿蒙 NEXT SDK,为鸿蒙应用提供了业界领先的全链路监控解决方案。这不仅仅是一个 SDK,更是您洞察用户体验、优化应用性能的智能伙伴。
549 27
|
1月前
|
监控 数据可视化 数据库
低代码的系统化演进:从工具逻辑到平台架构的技术解读
低代码正从开发工具演变为支撑企业架构的智能平台,融合可视化开发、AI引擎与开放生态,实现高效构建、自动化运维与跨场景协同,推动数字化转型迈向智能化、系统化新阶段。
|
1月前
|
Java Linux 虚拟化
【Docker】(1)Docker的概述与架构,手把手带你安装Docker,云原生路上不可缺少的一门技术!
1. Docker简介 1.1 Docker是什么 为什么docker会出现? 假定您在开发一款平台项目,您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。 您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。 您的企业还拥有标准化的测试和生产环境,且具有自身的配置和一系列支持文件。 **要求:**希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销 问题: 要如何确保应用能够在这些环境中运行和通过质量检测? 在部署过程中不出现令人头疼的版本、配置问题 无需重新编写代码和进行故障修复
321 2
|
2月前
|
Cloud Native API 开发者
Gemini 2.5 Flash 技术拆解:从 MoE 架构到阿里云生态落地指南
2025年9月,谷歌Gemini 2.5 Flash发布,性能提升5%、成本降24%,引发行业关注。其MoE架构、百万上下文与“思考”范式,助力阿里云开发者高效构建云原生应用。本文解析技术内核,结合汽车、物流等案例,提供落地指南与避坑建议,展望大模型与流计算融合前景。
365 6
|
1月前
|
存储 人工智能 搜索推荐
拔俗AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教融合大语言模型、教育知识图谱、多模态感知与智能体技术,重构“教、学、评、辅”全链路。通过微调LLM、精准诊断错因、多模态交互与自主任务规划,实现个性化教学。轻量化部署与隐私保护设计保障落地安全,未来将向情感感知与教育深度协同演进。(238字)
|
2月前
|
JSON 供应链 监控
1688商品详情API技术深度解析:从接口架构到数据融合实战
1688商品详情API(item_get接口)可通过商品ID获取标题、价格、库存、SKU等核心数据,适用于价格监控、供应链管理等场景。支持JSON格式返回,需企业认证。Python示例展示如何调用接口获取商品信息。

热门文章

最新文章