ECS主动运维专栏(1):从On-Premise本地化运维到On-Cloud云上运维的演进

简介: 从用户的声音中,我们听到用户对稳定、弹性、透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行。为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务。

阿里云经过9年多的发展,成长为中国第一全球前三的云服务提供商,为上百万用户提供IT基础设施云服务。这些用户几乎都会使用ECS弹性计算服务,这其中既有面向消费者(to C)、企业(to B)提供服务的互联网应用、电商、娱乐等类型的用户,也有面向企业内部效率提升搭建信息化数字化平台和应用的用户,还有广泛的个人网站、开发者等,不论哪种类型的用户,从购买创建第一台ECS云服务器开始,就已经进入了云上使用和运维的阶段。


与传统IDC环境相比,云上运维有哪些差异?大量的计算资源怎样方便快捷地部署、管理?如何发挥弹性响应业务负载变化的同时保持较低TCO总拥有成本?ECS出现异常是什么原因,如何保持业务连续性?……等等这些,是很多用户在使用和运维ECS过程中提出的问题。从用户的声音中,我们听到用户对稳定、弹性、透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行。为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务。


a1bfacc64030ca54e850ce0245459940d23a9f9b


今天,我们先来聊聊从On-Premise本地化运维到On-Cloud云上运维的演进历程。


On-Premise本地运维

在互联网服务和云计算兴起之前,IT技术多是为企业内部的信息化服务,而企业的IT能力多建设在On-Premise本地部署基础之上。企业基于其公司战略、运营模式、流程体系、组织架构等业务发展需要和特点设计对应的IT架构,通过建设自有数据中心或租用第三方IDC构建IT基础设施资源,在此基础上搭建应用系统,支持企业的发展。相应地,企业IT组织会设立开发、运维等职能的团队,以满足业务发展变化的需求和业务连续性的保障。


早期的IT设计多为企业内部信息化的需要服务,通过引入ERP、MRP、MES、PLM、CRM等商业软件,优化企业业务流程,提升企业运营效率。由这些商业软件解决方案的技术架构所决定,对应的基础架构多以商业数据库、小型机等专有服务器、光纤连接的存储区域网络(SAN)、存储阵列、磁带库等为主,这类基础架构组件以集中度高、单体稳定性强、纵向扩展为显著特点,通过单机扩展提升处理能力,实施技术难度较大,周期较长,管理复杂度较高,因而逐渐形成了以ITIL为最佳实践的运维管理体系,注重流程规范和控制风险。


随着互联网的发展和企业通过互联网与其客户紧密连接的需要,支撑企业对外服务客户的IT设计也逐渐发展和成熟,通过广泛应用开源软件,建立企业对客户的电子商务、社交网络、数据分析等能力,优化用户体验,提升客户价值。由这些开源软件解决方案的技术架构所决定,对应的基础架构多以开源数据库、X86通用服务器、本地块存储、对象存储、数据以太网络为主,这类基础架构组件以分布式部署、集群架构、横向扩展为显著特点,通过向集群增加节点扩展处理能力,实施随业务的快速变化而定,周期较短,方案组合灵活,因而逐渐形成了以DevOps为最佳实践的运维管理体系,注重效率敏捷和快速响应业务需求。


两种典型运维管理体系都会建立基础运维和应用运维团队,且由于初始投资较大,影响范围广泛,企业会格外重视硬件投资和基础运维工作,并安排经验丰富的基础运维工程师维护数据中心、服务器、存储、网络等硬件和软件工作。由于基础设施资源有限,设备采购、部署实施和调整周期较长,因而运维团队会设立一系列制度和流程,管理和控制资源的使用以及容量规划。


On-Cloud云上运维

云计算的兴起,为企业建立有竞争优势的IT能力提供了更强的支撑。企业IT组织利用云计算提供的按需自助服务、资源池化、弹性扩展伸缩、广泛网络连接等服务特性,进一步提升企业信息化和数字化能力,在快速变化的行业环境和日趋激烈的市场竞争中脱颖而出。


在企业IT组织中,不论其运维体系是以注重流程和管控的ITIL理念还是以注重效率和敏捷的DevOps理念为核心,面对On-Cloud的趋势,不变的始终是保持对业务需求的响应和对系统可靠性业务连续性的保障。而借助云计算的诸多特性和优势,企业运维的重心从重视面向基础环境的运维转向重视面向业务应用的运维,更有效地支撑企业战略和业务发展。在架构层面,借助云计算广泛多样的产品和服务,企业IT架构从竖井式向共享服务式发展,通过水平分布的系统架构实现对可用性的保障,并提升弹性扩展的能力,数据的流转提升对业务的洞察。同时,借助云计算资源池化、监控和编排等能力,IT运维组织对资源的使用和容量规划可以与业务变化及研发需求更紧密灵活地结合,从管控模式向服务模式转变;API、SDK的广泛使用使基础设施可编程,自动化的部署和编排进一步促进环境准备、灰度发布、在线变更的效率。


在互联网企业中,由于天生就需要面对大流量高并发的业务需求,往往从第一天搭建开始就已经采用了Cloud Native或Cloud Friendly的系统架构和运维方式。随着公有云服务的发展和成熟,互联网服务普遍采用All on 公有云或混合云的部署结构,会更适应On-Cloud云上运维形态,运维的重心保持在如何支撑快速发展变化的业务规模,弹性响应业务波动,快速高效地管理大规模海量资源等方面。


综上所述,云上运维向更自动、更敏捷、更弹性的趋势演进,但本质始终是赋能业务永续运行,助力企业战略目标和业务发展的实现。下一期,我们会在此基础上聊一聊如何在阿里云上建立云上IT运维能力。

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
25天前
|
并行计算 前端开发 异构计算
告别服务器繁忙,云上部署DeepSeek
本文以 DeepSeek-R1-Distill-Qwen-32B-FP8 为例,向您介绍如何在GPU实例上使用容器来部署量化的 DeepSeek-R1 蒸馏模型。
|
2月前
|
弹性计算 Ubuntu Linux
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS自动化部署。支持Ubuntu 22.04/20.04、CentOS 7.7-7.9及Alibaba Cloud Linux 3.2104 LTS。前提条件:ECS实例需运行中且有公网。步骤:选择Docker扩展并安装,验证成功通过命令`docker -v`查看版本号。
343 79
|
12天前
|
负载均衡 监控 架构师
「从零开始的云上建筑师速成班:用ROS编辑器搭个会呼吸的服务器小屋」
云上建筑师速成秘籍:用阿里云ROS架构编辑器像搭乐高一样玩转服务器!零代码拖拽资源+配置指南,从部署到拆家一条龙服务~
「从零开始的云上建筑师速成班:用ROS编辑器搭个会呼吸的服务器小屋」
|
9天前
|
机器学习/深度学习 人工智能 运维
基于AI的自动化服务器管理:解锁运维的未来
基于AI的自动化服务器管理:解锁运维的未来
54 0
|
10天前
|
并行计算 前端开发 异构计算
告别服务器繁忙,云上部署DeepSeek
告别服务器繁忙,云上部署DeepSeek
|
2月前
|
安全 大数据 Linux
云上体验最佳的服务器操作系统 - Alibaba Cloud Linux | 飞天技术沙龙-CentOS 迁移替换专场
本次方案的主题是云上体验最佳的服务器操作系统 - Alibaba Cloud Linux ,从 Alibaba Cloud Linux 的产生背景、产品优势以及云上用户使用它享受的技术红利等方面详细进行了介绍。同时,通过国内某社交平台、某快递企业、某手机客户大数据业务 3 大案例,成功助力客户实现弹性扩容能力提升、性能提升、降本增效。 1. 背景介绍 2. 产品介绍 3. 案例分享
|
2月前
|
运维
阿里云服务器批量执行命令(系统运维管理oos)
阿里云【系统运维管理oos】批量执行详情
64 5
|
3月前
|
存储 弹性计算 运维
端到端的ECS可观测性方案,助力云上业务安全稳定
本文介绍了云原生时代保障业务系统可靠性的方法和挑战,重点探讨了阿里云ECS在提升业务稳定性、性能监控及自动化恢复方面的能力。文章分为以下几个部分:首先,阐述了业务可靠性的三个阶段(事前预防、事中处理、事后跟进);其次,分析了云上业务系统面临的困难与挑战,并提出了通过更实时的监测和自动化工具有效规避风险;接着,详细描述了ECS实例稳定性和性能问题的解决方案;然后,介绍了即将发布的ECS Lens产品,它将全面提升云上业务的洞察能力和异常感知能力;最后,通过具体案例展示了如何利用OS自动重启和公网带宽自适应调节等功能确保业务连续性。总结部分强调了ECS致力于增强性能和稳定性的目标。
|
2月前
|
弹性计算 运维 Ubuntu
使用阿里云服务器自动搭建WordPress网站流程,超简单by系统运维管理OOS
本教程介绍如何使用阿里云服务器(ECS)和系统运维管理OOS自动搭建WordPress网站,支持Ubuntu、CentOS及Alibaba Cloud Linux等操作系统。前提条件包括ECS实例处于运行中、有公网IP且安全组已开启80端口。安装步骤简单:进入ECS快速购买控制台选择预装WordPress,确认下单后通过管理控制台查看实例详情并开放安全组端口。最后,通过实例公网IP访问,出现WordPress登录页即表示安装成功。
|
3月前
|
运维 Ubuntu 应用服务中间件
自动化运维之路:使用Ansible进行服务器管理
在现代IT基础设施中,自动化运维已成为提高效率和可靠性的关键。本文将引导您通过使用Ansible这一强大的自动化工具来简化日常的服务器管理任务。我们将一起探索如何配置Ansible、编写Playbook以及执行自动化任务,旨在为读者提供一条清晰的路径,从而步入自动化运维的世界。