系统运维日常工作有哪些,应该具备哪些技能

简介:

一、日常工作内容:

1
2
3
4
5
6
7
8
9
10
11
12
1、看监控、网站流量,CDN流量,看邮件有没有普通业务监控报警,看邮件中有没其他需要做的工作
2、处理报警,查看报警的原因,和开发一起解决,并且尽量找出避免再次发生的方法,例如添加一些
定时清理脚本
3、处理发布,基本都是自动化,但是总有发布不成功或者需要回滚的时候,这时候就需要手工介入,
找到原因,并跟开发一起讨论最后是否撤销还是重上
4、日常一起能够自动化的工作尽量找到自动化的方法
5、配合开发搭建测试环境,线上环境,上线代码,以及日常开个权限
6、定期机房巡检
7、灾备演练计划
8、运维流程的设定与标准化
9、运维知识库文档的建立
10、新技术的学习与研究

二、运维应该具备哪些技能:

1
2
3
4
5
6
7
8
9
10
11
12
1、了解运维技术的分类:赵班长写的运维知识体系:https: //www .unixhot.com /page/ops 
2、熟悉常见Linux系统(以CentOS /Redhat 为主)和故障处理;
3、熟练shell脚本,熟悉php、perl、python、ruby等至少一种开发语言;
4、熟悉常见应用服务(如:Nginx、Tomcat、HAProxy、Redis、RabbitMQ等)的配置维护
及优化(比如NGINX代理,负载均衡);
5、熟悉MySQL数据库的部署配置和优化(读写分析,负载均衡,分布式数据库);
6、熟悉任意一种自动化管理工具的使用(如:SaltStack、Puppet或Ansible等);
7、熟悉任意一种常见监控系统的使用(如:Zabbix、Nagions、Ganglia);
8、了解基本的网络知识;
9、对常见对云服务有一定了解,有过阿里云、亚马逊等云主机维护经验者
优先。
10、熟悉各种虚拟化技术,比如 KVM、XEN等。并有在虚拟化平台上面维护或开发的经验










本文转自 冰冻vs西瓜 51CTO博客,原文链接:http://blog.51cto.com/molewan/1936482,如需转载请自行联系原作者
目录
相关文章
|
3月前
|
运维 Linux Apache
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
95 3
|
3月前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第2天】 在当今数字化时代,运维管理成为企业IT部门的重要任务。本文将探讨如何通过高效的运维管理策略和最佳实践,提升系统的稳定性,确保业务持续平稳运行。通过分析常见问题、预防措施以及应对策略,我们将揭示高效运维的关键要素,助您打造一个可靠的IT环境。
|
20天前
|
机器学习/深度学习 运维 监控
利用深度学习进行系统健康监控:智能运维的新纪元
利用深度学习进行系统健康监控:智能运维的新纪元
91 30
|
2月前
|
运维 监控 网络协议
运维工程师日常工作中最常用的20个Linux命令,涵盖文件操作、目录管理、权限设置、系统监控等方面
本文介绍了运维工程师日常工作中最常用的20个Linux命令,涵盖文件操作、目录管理、权限设置、系统监控等方面,旨在帮助读者提高工作效率。从基本的文件查看与编辑,到高级的网络配置与安全管理,这些命令是运维工作中的必备工具。
225 3
|
2月前
|
缓存 运维 监控
【运维必备知识】Linux系统平均负载与top、uptime命令详解
系统平均负载是衡量Linux服务器性能的关键指标之一。通过使用 `top`和 `uptime`命令,可以实时监控系统的负载情况,帮助运维人员及时发现并解决潜在问题。理解这些工具的输出和意义是确保系统稳定运行的基础。希望本文对Linux系统平均负载及相关命令的详细解析能帮助您更好地进行系统运维和性能优化。
103 3
|
2月前
|
运维 监控 中间件
数据中心运维监控系统产品价值与优势
华汇数据运维监控系统面向IT基础架构及IT支撑平台的监控和运维管理,包含监测、分析、展现和告警。监控范围涵盖了网络设备、主机系统、数据库、中间件和应用软件等。
82 4
|
3月前
|
运维 自然语言处理 开发者
作为一名运维人员,使用通义灵码个人版处理日常工作中的代码相关任务,极大地提升了我的工作效率。以下是我使用通义灵码的具体实践场景、效果和心得,以及相应的截图。
作为一名运维人员,我使用通义灵码处理日常工作中的代码任务,效率提升了30%。通义灵码帮助我快速理解复杂代码、生成准确的代码注释,并能从自然语言生成代码示例,大幅减少了代码编写和理解的时间。
114 3
|
3月前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第13天】 本文探讨了高效运维管理的关键策略和实践,旨在帮助运维团队提升系统的稳定性。通过分析常见问题,提出具体的解决方案,包括监控与告警、自动化工具的应用、故障排查与恢复、性能优化以及安全防护等方面。通过这些策略和实践,可以帮助企业构建一个稳定、可靠且高效的IT系统。
114 1
|
2月前
|
运维 监控 网络协议
自动化运维的魔法——打造高效、可靠的系统
【10月更文挑战第32天】在数字化时代的浪潮下,运维不再是简单的硬件维护和故障排除。它已经演变成一场关乎效率、稳定性和创新的技术革命。自动化运维,作为这场革命的核心,正引领着企业走向更加智能和高效的未来。本文将带你探索自动化运维的世界,揭示其背后的原理和实践,让你领略到自动化带来的无限可能。
39 0
|
3月前
|
运维 监控 安全
构建高效运维体系:从监控到自动化的全面指南在当今数字化时代,运维作为保障系统稳定性和效率的重要环节,其重要性不言而喻。本文将深入探讨如何构建一个高效的运维体系,从监控系统的搭建到自动化运维的实施,旨在为读者提供一套完整的解决方案。
本文详细介绍了高效运维体系的构建过程,包括监控系统的选择与部署、日志分析的方法、性能优化的策略以及自动化运维工具的应用。通过对这些关键环节的深入剖析,帮助运维人员提升系统的可靠性和响应速度,降低人工干预成本,实现业务的快速发展和稳定运行。

热门文章

最新文章