高级运维工程师的打怪升级之路

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
传统型负载均衡 CLB,每月750个小时 15LCU
简介: 高级运维工程师的打怪升级之路

人生就像一场游戏,这场游戏给我们带来了的许多困难,但是我们为了梦想,为了家人,为了自己不断奋斗着,努力工作。

今天就让我带着大家一起回顾高级运维工程师打怪升级之路。

运维工程师在刚入行阶段是一很苦逼的,可能干着修电脑、掐网线、搬机器的活,显得没地位!时间也很碎片化,各种零碎的琐事围绕着你,也很难体现个人价值,渐渐的对行业很迷茫,觉得没什么发展前途。

这些枯燥无味工作的确会使人匮乏!技术是枯燥无味的,这些基本工作并非是多余的,这些经验会对后期的运维工作带来一定的帮助。所以在这个时期一定要保持积极向上的心态,持续的学习,争取找一个更锻炼人的工作!

职业发展

技术专家

发展规划:初中级工程师 -> 高级工程师 -> 架构师 -> 专家

适宜人群:比较喜欢挑战,热爱技术,有较强钻研精神,在某一领域有深入的理解,性格比较内向。

技术管理

发展规划:初中级工程师 -> 高级工程师 -> 主管/经理 -> 总监 -> CTO(首席技术官)

适宜人群:技术知识面广,有一些管理思维,善于交际,表达沟通能力强,经常关注行业内动态和主流技术。


初级

主要工作

  • 修电脑,设备巡检
  • 服务器上下架
  • 网络服务部署
  • 网站平台搭建与维护

1、Linux基础

刚开始阶段需要熟悉Linux操作系统安装,目录结构、启动流程等。

2、系统管理

主要学习Linux系统,生产环境中基本都在字符界面完成工作,所以要掌握常用的几十个基本管理命令,包括用户管理、磁盘分区、软件包管理、文件权限、文本处理、进程管理、性能分析工具等。

3、网络基础

OSI和TCP/IP模型一定要熟悉。基本的交换机、路由器概念及实现原理要知道。

4、Shell脚本编程基础

掌握Shell基本语法结构,能编写简单的脚本即可。


中级

主要工作

  • 集群网站平台搭建
  • 数据库基本管理
  • 监控系统搭建
  • 脚本化工作

1、网络服务

常见的网络服务要会部署,比如vsftp、nfs、samba、bind、dhcp等。

代码版本管理系统少不了,可以学习下主流的GIT,能部署和简单使用就可以了。

经常在服务器之间传输数据,所以要会使用:rsync和scp。

数据同步:inotify/sersync。

重复性完成一些工作,可写成脚本定时去运行,所以得会配置Linux下的定时任务服务crond。

2、Web服务

每个公司基本都会有网站,能让网站跑起来,就需要搭建Web服务平台了。

如果是用PHP语言开发的,通常搭建LNMP网站平台,这是一个技术名词组合的拼写,分开讲就是得会部署Nginx、MySQL和PHP。

如果是JAVA语言开发的,通常使用Tomcat运行项目,为了提高访问速度,可以使用Nginx反向代理Tomcat,Nginx处理静态页面,Tomcat处理动态页面,实现动静分离。

不是会部署这么简单,还要知道HTTP协议工作原理、简单的性能调优。

3、负载均衡器

单台服务器终究资源有限,抵抗高访问量肯定是无法支撑的,解决此问题最关键的技术就是采用负载均衡器,水平扩展多台Web服务器,同时对外提供服务,这样就成倍扩展性能了。负载均衡器主流开源技术有LVS、HAProxy和Nginx。一定要熟悉一两个!

4、数据库

数据库选择MySQL,它是世界上使用最为广泛的开源数据库。学它准没错!

也要会一些简单的SQL语句、用户管理、常用存储引擎、数据库备份与恢复。

想要深入点,必须会主从复制、性能优化、主流集群方案:MHA、MGR等。

NoSQL这么流行当然也少不了,学下Redis、MongoDB这两个就好了。

5、监控系统

监控必不可少,是及时发现问题和追溯问题的救命稻草。可以选择学习主流的Zabbix、Prometheus开源监控系统,功能丰富,能满足企业级监控需求。监控点包括服务器硬件、服务器性能、API、业务、PV/UV、日志等方面。

也可以弄个仪表盘展示几个实时关键的数据,比如Grafana,会非常炫酷。

6、日志分析系统

日志也很重要,定期的分析,可发现潜在隐患,提炼出有价值的东西。

主流日志系统:ELK Stack

学会部署使用,能分析日志并可视化,方便故障排查。

7、安全防范

安全很重要,不要等到系统被了,再做安全策略,此时已晚!所以,当一台服务器上线后应马上做安全访问控制策略,比如使用iptables限制只允许信任源IP访问,关闭一些无用的服务和端口等。
一些常见的
类型一定得知道啊,否则怎么对症下药呢!比如CC、DDOS、ARP等。

8、Shell脚本编程进阶

Shell脚本是Linux自动完成工作的利器,必须得熟练编写,所以得进一步学习函数、数组、信号、发邮件等。

文本处理三剑客(grep、sed、awk)得玩6啊,Linux下文本处理就指望它们了。

9、Python/Go开发基础

Shell脚本只能完成一些基本的任务,想要完成更复杂些的任务,比如调用API、多进程等。就需要学高级语言了。

Python是运维领域使用最多的语言,简单易用,学它准没错!此阶段掌握基础就可以了,例如基本语法结构、文件对象操作、函数、迭代对象、异常处理、发邮件、数据库编程等。


高级

主要工作

  • 亿级网站架构设计
  • 性能优化
  • 容器化落地
  • 大规模自动化运维
  • 平台化工作

1、Web静态缓存

用户老喊着访问网站慢,看看服务器资源还很富裕啊!网站访问慢也许不是服务器资源饱和导致的,影响因素很多,例如网络、转发层数等。

对于网络,存在南北通信问题,之间访问会慢,这个可以使用CDN解决,同时缓存静态页面,尽可能将请求拦截在最上层响应,减少后端请求和响应时间。

如果不用CDN,也可以使用Squid、Varnish、Nginx这样的缓存服务实现静态页面缓存,放到流量入口处。

2、集群

单台服务器终究资源有限,抵抗高访问量肯定是无法支撑的,解决此问题最关键的技术就是采用负载均衡器,水平扩展多台Web服务器,同时对外提供服务,这样就成倍扩展性能了。负载均衡器主流开源技术有LVS、HAProxy和Nginx。一定要熟悉一两个!

Web服务器性能瓶颈解决了,数据库更为关键,还是采用集群,就拿MySQL来说,可以一主多从架构,在此基础上读写分离,主负责写,多从负责读,从库可水平扩展,前面再来个四层负载均衡器,承载千万级PV,妥妥的!

高可用软件也得会,避免单点的利器,主流的有Keepalived、Heartbeat等。

随着业务扩展,网站图片越来越多!NFS共享存储支撑不过了,处理很慢!上分布式文件系统,并行处理任务,无单点,高可靠,高性能等特性,主流的有FastDFS、MFS、HDFS、Ceph、GFS等。初期的话我建议学习下FastDFS,能满足中小规模需求。

3、容器化

硬件服务器资源利用率很低,甚是浪费!可以把空闲多的服务器虚拟化,弄成很多个的虚拟机,每个虚拟机就是一个完整的操作系统。可以很大程度提高资源利用率。主流私有云平台实现:KVM+OpenStack

虚拟机作为基础平台还可以,但应用业务弹性伸缩也太重量了吧!启动好几分钟,文件又这么大,快速扩展太费劲了!

好说,上容器,容器主要特点就是快速部署和环境隔离。一个服务封装到镜像中,分分钟钟可创建几百个容器。

主流的容器技术非Docker莫属了。

当然,生产环境单机Docker大多数情况下是无法满足业务需求的,可以基于Kubernetes构建容器平台,集群化管理容器,形成一个大的资源池,为基础架构提供有力的支撑。

4、自动化运维

反反复复重复的工作,不但提高不了效率,价值也得不到体现。

一切运维工作标准化,例如环境版本、目录结构、操作系统等统一。在标准化基础上才能更方面的自动化,点点鼠标或者敲几个命令即可完成一项复杂的工作任务,爽哉爽哉!

因此,所有的操作尽可能自动化,减少人为失误,提高工作效率。

主流服务器集中管理工具:Ansible、Saltstack

持续集成工具:Jenkins、Gitlab

5、Python开发进阶

可以再深入学习下Python开发,掌握面向对象编程。

最好也掌学习一个Web框架开发网站,例如Django、Flask,主要是开发运维管理系统,将一些复杂的流程写到平台中,再集成集中管理工具,可打造一个属于运维自己的管理平台。

7、性能优化

只会部署是远远不够的,性能优化能最大化提升服务承载量。

这块也是比较难的,也是高薪的关键点之一,为了钱也得下点功夫学习啊!

可以从硬件层、操作系统层、软件层和架构层维度展开思考。

小结

武器类型 武器名称
文本处理 grep、sed、awk
数据传输 Rsync、Scp、Inodify/Sersync
进程管理 Supervisor
性能分析 top、free、df、iftop、iostat、vmstat、dstat、sar、sysdig
网络服务 vsftp、nfs、samba、bind、dhcp、postfix
Web服务 Apache、NginxTomcat、JBoss、Resin
数据库 MySQL、MariaDB、PostgreSQL,Oracle
NoSQL Redis、MongoDB
消息中间件 RabbitMQ、ActiveMQ
版本管理 SVN、Git
静态缓存 Squid、Varnish、Nginx
负载均衡 LVS、HAProxy、Nginx
高可用软件 Keepalived、Heartbeat、DRBD、corosync+pacemaker
集中管理工具 Ansible、Saltstack、Chef、Puppet
虚拟化 KVM、Xen、Openstack、Cloudstack
容器化 Docker、Kubernetes、Rancher、Openshift
自动装机 Kickstart、Cobbler
抓包分析 Tcpdump、Wireshark
持续集成 Jenkins、Gitlab
MySQL代理 Altas、Cobar、Mycat
压测 ab、fio、sysbench、mysqlslap、Jemter
日志系统 ELK Stack、Graylog
监控 Zabbix、Prometheus、Open-falcon
分布式文件系统 Ceph、GlusterFS、FastDFS

金三银四,找工作难?

“金三银四“ 跳槽季,准备好换工作了吧!心里想得美滋滋,现实却残酷得赤裸裸,投了很多简历,面试率低的可怜,都说金三银四,可为什么我换工作就这么难呢?

根据阿良经验,主要原因如下:

  1. 简历不够明确清晰(10%)
  2. 没掌握面试技巧(10%)
  3. 选择工作的态度(10%)
  4. 不明确自己的价值(5%)
  5. 专业技能不足(55%)
  6. 学历(5%)
  7. 行业不景气:停招、裁员!(5%)

意识

1、坚持

学习是一个很漫长的过程,是我们每个人需要用一生去坚持的事业。

贵在坚持,难在坚持,成在坚持!

2、目标

没有目标的不叫工作,没有量化的不叫目标。

每到一个阶段,制定一个目标。

比如:先定一个能达到的小目标,挣它一个亿!

3、兴趣

如果你热爱这个行业,那它就不只是一份工作。

如果你不热爱这个行业,可能是做不好,也可能坚持不超过2年,因为你心里上过不去。

方向对了,就不怕路远了!

详细细节,请查看视频:
云盘地址: https://pan.baidu.com/s/1WW4DCmiEJ1W_1epHj8SWmQ
在线版: https://ke.qq.com/course/266656
相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
21天前
|
运维 监控 网络协议
|
1月前
|
存储 运维 搜索推荐
|
6月前
|
运维 网络协议 Linux
【专栏】 20 个 Linux 命令,运维工程师工作时最常用的
【4月更文挑战第28天】本文介绍了运维工程师常用的20个Linux命令,包括`ls`、`cd`、`pwd`、`mkdir`、`rm`、`cp`、`mv`、`cat`、`more`、`less`、`head`、`tail`、`grep`、`find`、`chmod`、`chown`、`chgrp`、`ps`、`top`和`ifconfig`,帮助提升工作效率。此外,还提到了其他常用的命令如`df`、`free`、`tar`、`ssh`、`scp`、`ping`、`netstat`、`iptables`、`systemctl`、`hostname`等,建议运维人员掌握以应对各种运维场景。
541 1
|
3月前
|
运维 Kubernetes 关系型数据库
云计算运维工程师面试技巧
【8月更文挑战第6天】
384 1
|
4月前
|
弹性计算 运维 Linux
运维工程师必备的摸鱼神器:阿里云智能助手OS Copilot
OS Copilot 概述与体验评测摘要 阿里云的OS Copilot是一款基于大模型的智能操作系统助手,作为高级运维工程师,体验者发现它在系统诊断和性能优化上尤其有用,简化了如重置ECS密码和安全组配置等任务,提升了工作效率。 OS Copilot的易用性和安全性得到肯定,操作手册详细且交互性强,减少了用户在不同页面间切换的需要。在辅助编程方面,它能帮助非专业开发者编写和理解代码,对运维工作中的开发技能补充有很大帮助。与GitHub Copilot等产品相比,OS Copilot的独特之处在于结合了Linux操作的支持。
244 3
运维工程师必备的摸鱼神器:阿里云智能助手OS Copilot
|
4月前
|
Java BI 运维
开发与运维配置问题之升级机器配置后出现频繁的GC问题和超长的GC时间如何解决
开发与运维配置问题之升级机器配置后出现频繁的GC问题和超长的GC时间如何解决
34 1
|
4月前
|
运维 知识图谱 Python
专为运维工程师设计!阿里藏经阁出品的Python实战手册被我搞来了
Python 可能是极少数既简单又强大的编程语言中的一种。更重要的是,用它来编程是非常快乐的事。 今天给小伙伴们分享的是阿里“藏经阁”出品的专门给运维工程师设计的Python实战手册
|
6月前
|
运维 监控 项目管理
运维工程师的出路到底在哪里?—— 浅谈运维工程师前景
运维工程师的出路到底在哪里?—— 浅谈运维工程师前景
645 3
|
6月前
|
运维 Linux
CentOS系统openssh-9,你会的还只有初级Linux运维工程师的技术吗
CentOS系统openssh-9,你会的还只有初级Linux运维工程师的技术吗
|
6月前
|
运维 安全 数据库
【运维面试】校企合作运维工程师12-16K薪资面试题
【运维面试】校企合作运维工程师12-16K薪资面试题