ECS主动运维专栏(1):从On-Premise本地化运维到On-Cloud云上运维的演进

简介: 从用户的声音中,我们听到用户对稳定、弹性、透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行。为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务。

阿里云经过9年多的发展,成长为中国第一全球前三的云服务提供商,为上百万用户提供IT基础设施云服务。这些用户几乎都会使用ECS弹性计算服务,这其中既有面向消费者(to C)、企业(to B)提供服务的互联网应用、电商、娱乐等类型的用户,也有面向企业内部效率提升搭建信息化数字化平台和应用的用户,还有广泛的个人网站、开发者等,不论哪种类型的用户,从购买创建第一台ECS云服务器开始,就已经进入了云上使用和运维的阶段。


与传统IDC环境相比,云上运维有哪些差异?大量的计算资源怎样方便快捷地部署、管理?如何发挥弹性响应业务负载变化的同时保持较低TCO总拥有成本?ECS出现异常是什么原因,如何保持业务连续性?……等等这些,是很多用户在使用和运维ECS过程中提出的问题。从用户的声音中,我们听到用户对稳定、弹性、透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行。为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务。


a1bfacc64030ca54e850ce0245459940d23a9f9b


今天,我们先来聊聊从On-Premise本地化运维到On-Cloud云上运维的演进历程。


On-Premise本地运维

在互联网服务和云计算兴起之前,IT技术多是为企业内部的信息化服务,而企业的IT能力多建设在On-Premise本地部署基础之上。企业基于其公司战略、运营模式、流程体系、组织架构等业务发展需要和特点设计对应的IT架构,通过建设自有数据中心或租用第三方IDC构建IT基础设施资源,在此基础上搭建应用系统,支持企业的发展。相应地,企业IT组织会设立开发、运维等职能的团队,以满足业务发展变化的需求和业务连续性的保障。


早期的IT设计多为企业内部信息化的需要服务,通过引入ERP、MRP、MES、PLM、CRM等商业软件,优化企业业务流程,提升企业运营效率。由这些商业软件解决方案的技术架构所决定,对应的基础架构多以商业数据库、小型机等专有服务器、光纤连接的存储区域网络(SAN)、存储阵列、磁带库等为主,这类基础架构组件以集中度高、单体稳定性强、纵向扩展为显著特点,通过单机扩展提升处理能力,实施技术难度较大,周期较长,管理复杂度较高,因而逐渐形成了以ITIL为最佳实践的运维管理体系,注重流程规范和控制风险。


随着互联网的发展和企业通过互联网与其客户紧密连接的需要,支撑企业对外服务客户的IT设计也逐渐发展和成熟,通过广泛应用开源软件,建立企业对客户的电子商务、社交网络、数据分析等能力,优化用户体验,提升客户价值。由这些开源软件解决方案的技术架构所决定,对应的基础架构多以开源数据库、X86通用服务器、本地块存储、对象存储、数据以太网络为主,这类基础架构组件以分布式部署、集群架构、横向扩展为显著特点,通过向集群增加节点扩展处理能力,实施随业务的快速变化而定,周期较短,方案组合灵活,因而逐渐形成了以DevOps为最佳实践的运维管理体系,注重效率敏捷和快速响应业务需求。


两种典型运维管理体系都会建立基础运维和应用运维团队,且由于初始投资较大,影响范围广泛,企业会格外重视硬件投资和基础运维工作,并安排经验丰富的基础运维工程师维护数据中心、服务器、存储、网络等硬件和软件工作。由于基础设施资源有限,设备采购、部署实施和调整周期较长,因而运维团队会设立一系列制度和流程,管理和控制资源的使用以及容量规划。


On-Cloud云上运维

云计算的兴起,为企业建立有竞争优势的IT能力提供了更强的支撑。企业IT组织利用云计算提供的按需自助服务、资源池化、弹性扩展伸缩、广泛网络连接等服务特性,进一步提升企业信息化和数字化能力,在快速变化的行业环境和日趋激烈的市场竞争中脱颖而出。


在企业IT组织中,不论其运维体系是以注重流程和管控的ITIL理念还是以注重效率和敏捷的DevOps理念为核心,面对On-Cloud的趋势,不变的始终是保持对业务需求的响应和对系统可靠性业务连续性的保障。而借助云计算的诸多特性和优势,企业运维的重心从重视面向基础环境的运维转向重视面向业务应用的运维,更有效地支撑企业战略和业务发展。在架构层面,借助云计算广泛多样的产品和服务,企业IT架构从竖井式向共享服务式发展,通过水平分布的系统架构实现对可用性的保障,并提升弹性扩展的能力,数据的流转提升对业务的洞察。同时,借助云计算资源池化、监控和编排等能力,IT运维组织对资源的使用和容量规划可以与业务变化及研发需求更紧密灵活地结合,从管控模式向服务模式转变;API、SDK的广泛使用使基础设施可编程,自动化的部署和编排进一步促进环境准备、灰度发布、在线变更的效率。


在互联网企业中,由于天生就需要面对大流量高并发的业务需求,往往从第一天搭建开始就已经采用了Cloud Native或Cloud Friendly的系统架构和运维方式。随着公有云服务的发展和成熟,互联网服务普遍采用All on 公有云或混合云的部署结构,会更适应On-Cloud云上运维形态,运维的重心保持在如何支撑快速发展变化的业务规模,弹性响应业务波动,快速高效地管理大规模海量资源等方面。


综上所述,云上运维向更自动、更敏捷、更弹性的趋势演进,但本质始终是赋能业务永续运行,助力企业战略目标和业务发展的实现。下一期,我们会在此基础上聊一聊如何在阿里云上建立云上IT运维能力。

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3天前
|
运维 应用服务中间件 网络安全
自动化运维的利器:Ansible在服务器管理中的应用
【8月更文挑战第28天】本文深入探讨了Ansible在简化和自动化服务器管理工作中的强大功能及其实际应用。通过浅显易懂的语言和具体示例,展示了如何利用Ansible进行批量配置、部署应用以及执行系统管理任务,旨在为读者提供一套完整的解决方案,以便更好地理解和应用Ansible,从而提高工作效率和减轻运维负担。
|
2天前
|
运维 Ubuntu 应用服务中间件
自动化运维:使用Ansible管理服务器
【8月更文挑战第29天】在当今快速发展的IT领域,自动化运维已成为提升效率和减少人为错误的关键技术。本文将引导你了解如何使用Ansible这一强大的自动化工具来简化服务器管理任务。从基础的安装、配置到高级的应用部署与维护,我们将一步步揭示Ansible如何让你轻松掌控多台服务器,确保系统稳定运行。文章末尾,你还将找到实用的代码示例,助你立刻上手实践。
|
4天前
|
运维 算法 调度
深入理解操作系统:进程调度与优先级自动化运维:使用Ansible实现服务器集群管理
【8月更文挑战第27天】在操作系统的众多奥秘中,进程调度无疑是一个既简单又复杂的主题。它就像是交响乐团中的指挥,协调着每一个音符,确保乐曲和谐而有序地进行。本文将带领读者走进进程调度的世界,探索其背后的原理和实现,同时通过代码示例揭示其精妙之处。让我们一起揭开进程调度的神秘面纱,理解它在操作系统中的重要性。
|
5天前
|
缓存 运维 监控
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
|
7天前
|
运维 应用服务中间件 网络安全
自动化运维:使用Ansible进行服务器配置管理
【8月更文挑战第24天】随着信息技术的迅速发展,服务器数量不断增加,手动管理服务器配置变得繁琐且容易出错。本文将介绍如何使用Ansible这一强大的自动化工具简化服务器配置管理过程,通过代码示例展示其实际应用,并讨论自动化运维在现代IT环境中的重要性和优势。
|
9天前
|
运维 jenkins Linux
【Jenkins稳定运维】服务器频繁崩溃?资深管理员的应对策略
本文分享了作者作为管理员在面对服务器频繁崩溃时的应对策略,包括使用Shell脚本优化运维工作、学习Jenkins Pipeline插件以及一些运维技能扩展,强调了在运维工作中不断学习和实践的重要性。
24 0
【Jenkins稳定运维】服务器频繁崩溃?资深管理员的应对策略
|
2天前
|
运维 网络安全
自动化运维:使用Ansible管理服务器
【8月更文挑战第29天】在这篇文章中,我们将探讨如何使用Ansible进行自动化运维。Ansible是一款开源的IT自动化工具,可以用于配置管理、应用部署和任务自动化等。我们将通过实际的代码示例,展示如何利用Ansible来简化日常的运维任务,提高工作效率。无论你是新手还是有经验的运维人员,这篇文章都将为你提供有价值的信息和技巧。
|
5天前
|
运维 Ubuntu 应用服务中间件
自动化运维:使用Ansible进行服务器配置管理##
【8月更文挑战第26天】 在快节奏的IT世界里,时间就是一切。这篇文章将引导你通过实际案例学习如何利用Ansible工具来优化你的服务器配置管理过程。我们将一起探索Ansible的魔力,看看它是如何让重复的任务变得简单而高效。准备好了吗?让我们开始吧! ##
|
7天前
|
运维 应用服务中间件 nginx
自动化运维之路:使用Ansible管理服务器
【8月更文挑战第24天】在追求效率的今天,自动化运维已成为IT领域的必修课。本文将通过介绍Ansible这一强大的自动化工具,带你领略自动化运维的魅力。我们将从Ansible的基础概念开始,逐步深入到实战应用,最终实现对服务器的高效管理。无论你是运维新手还是资深专家,这篇文章都将为你开启一扇通往自动化世界的大门。
|
7天前
|
运维 安全 应用服务中间件
自动化运维:使用Ansible进行服务器管理
【8月更文挑战第24天】在现代IT环境中,自动化运维已成为提高生产效率、减少人为错误的关键。本文将介绍如何使用Ansible这一强大的自动化工具来简化日常的服务器管理工作,包括安装、配置更新和批量操作等任务。通过实际案例,我们将深入探讨Ansible的使用方法及其带来的效率提升。
下一篇
云函数