开发者社区> 袋鼠云艾迪> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

云计算简介

简介: 云计算简介: 云计算:一群提供服务的计算机的整体 提供服务(通信网络) 云服务:用户按需消费、使用 云计算运维做什么: 7*24 小时快速响应 故障处理 备份恢复 系统安全 软件部署 监控报警 架构调优 统计分析 脚本开发(自动化) 发展方向: 资深运.
+关注继续查看

云计算简介:
云计算:一群提供服务的计算机的整体
提供服务(通信网络)
云服务:用户按需消费、使用
云计算运维做什么:
7*24 小时快速响应
故障处理
备份恢复
系统安全
软件部署
监控报警
架构调优
统计分析
脚本开发(自动化)

发展方向:
资深运维工程师
运维平台研发工程师
数据库工程师
运维总监
架构师

系统运维工程师:基础设施部署、应用环境部署、与开发协作更新应用版本、性能监控、容 量规划、备份、响应处理运维故障、优化系统性能、改善自身运维方法流程

常用的开源软件:

操作系统:centos,ubantu
网站:nginx,php-fpm,tomcat
关系型数据库:mysql nosql:redis,mongodb
代理:lvs,keepalived,haproxy
版本控制:gitlab
监控:zabbix
批量管理:ansible
打包工具:jenkins
日志分析:ELK(ElasticSearch+Logstash+Kibana)
脚本语言:shell,python

故障解决思路:
1.根据故障现象判断故障产生的影响,确定优先级
2.尽快恢复服务
a) 服务出错、假死:重启服务
b) 版本问题:保存日志待查,回滚版本
c) 资源不足:暂时关闭次要服务、紧急扩容
3.定位故障原因:
配置、版本是否变更
查看日志
4.后续完善响应监控
5.制定应急方案

运维的分类

系统运维:管理服务器、基础服务搭建、负载均衡、高可用、CDN、系统优化 
桌面运维:管理客户端、企业桌面维护、办公设备维护、网络维护
网络运维:管理网络设备、服务器上架、硬件设备故障监控、设备保修 
应用运维:参与产品设计、应用部署上线、版本更新、应用故障处理
运维研发:运维平台开发、基础设施开发(中间件、维护软件)、自动化运维 
数据库运维:数据库设计、优化、监控、备份、灾备
运维安全:制定安全制度、安全培训、风险评估、漏洞检测

服务器:能够为其他计算机提供服务的更高级的电脑(更加稳定、高效)

分类:机架式、塔式、机柜式、刀片式 

选择服务器的指标:

1.需求决定一切,着眼未来
2.不要贪图便宜,电费远比你想象的贵 
3.机房中的空间是稀缺资源,机架式比塔式性价比更高 
4.管理方便:比如螺丝少、支持远程控制 
5.硬件通用性好,尤其是驱动
6.厂商支持
7.可替代产品是否广泛
8.在一定规模范围内,云主机的性价比更高 
服务器尺寸:1U≈4.445 厘米
机柜容量:22U、37U、42U(主流) 
网络设备机柜:600 或 800mm 
服务器机柜:900 或 1000mm 
选型参数:
  支持的 CPU 颗数、CPU 核心数
  内存插槽数(最少 24 个)、最大支持内存容量 
  硬盘接口(服务器:SAS,家用机:SATA)、盘架个数、最大支持硬盘容量 
  RAID 卡支持级别、RAID 卡电池
  电源数量、整机功率

典型服务模式(C/S:Client/Server 架构):

服务器:提供资源或某种功能
客户机:使用资源、功能

架构方式:

1.SMP 服务器:主要特征是共享。系统中所有的资源(例如:CPU、内存、I/O 等)都是 共享的。扩展能力有限,最受限制的是内存,当 CPU 数量增多时,会导致内存紊乱,降低 CPU 效率。效率最高的 CPU 数量是 2~4 个
2.NUMA 服务器:主要特征是具有多个 CPU 模块,每个 CPU 模块由多个 CPU 组成,并且 具有独立的内存、I/O 等。当需要运行大内存应用时,需要向其他模块借调内存 

CPU 选择:

1.主要指标有缓存、主频、核心数量,服务器的 CPU 一般都是 XEON 
2.CPU 物理核心数量越多,并发行越强,不包括超线程。超线程在 CPU 密集型计算, 高负载的时候没有任何效果,甚至还会拖慢系统速度 
3.CPU 主频越高单次计算速度就越快 
4.CPU 缓存大的性能好 
5.不同主频的内存不要混插
6.多通道的一定要按组接入,多 CPU 的按组对称分布,一般主板内存槽同组都会标示 相同的颜色 
7.RAID 卡很重要,带高速缓存的好,带备用电池单元的好,硬 RAID 卡(自带数据存 储和专用 CPU)比软 RAID 卡好 

硬盘选择:

1.硬盘转速
2.做 RAID 不能混用 
3.SSD 在随机 I/O 读写上性能非常好 
4.在格式化 SSD 分区的时候要注意对齐,影响 I/O 速度 
5.在内核队列上选择 NOOP 效果比较好 
功耗:如果选配的最大功耗大于电源模块的最大输出就需要考虑购买多个电源模块。电源不 考虑冗余
基于智能平台管理接口(IPMI:Intelligent Platform Management Interface)协议的服务 器带外管理工具
让用户通过网络来监控服务器上各种硬件组件的健康状况,如 CPU 电压、风扇转速、系 统温度、功耗等,开放的免费标准 
DELL 的管理命令:IPMITOOL 
DELL 工具名称:iDRAC
参数:-U 登陆用户名 
  -P 登陆密码
  -H 远程主机地址
  -power 电源管理模块 
  -sel 硬件日志管理 
  -sol 串口重定向

网络设备选型:

交换机:端口数量、端口速率、背板带宽、POE 供电(有源以太网) 
路由器:内存、flash、协议支持、模块扩展

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
全方位解读服务网格(Service Mesh)的背景和概念
为了解决微服务框架的侵入性问题,我们引入服务网格。
1224 0
PolarDB 并行查询的前世今生
本文会深入介绍PolarDB MySQL在并行查询这一企业级查询加速特性上做的技术探索、形态演进和相关组件的实现原理,所涉及功能随PolarDB MySQL 8.0.2版本上线。
492 0
企业内部应用接入钉钉获取部门及人员信息
企业内部应用接入钉钉,同时通过API获取当前企业下部门及人员信息
1175 0
MySQL模糊查询再也用不着 like+% 了!
我们都知道 InnoDB 在模糊查询数据时使用 "%xx" 会导致索引失效,但有时需求就是如此,类似这样的需求还有很多,例如,搜索引擎需要根基用户数据的关键字进行全文查找,电子商务网站需要根据用户的查询条件,在可能需要在商品的详细介绍中进行查找,这些都不是B+树索引能很好完成的工作。 通过数值比较,范围过滤等就可以完成绝大多数我们需要的查询了。但是,如果希望通过关键字的匹配来进行查询过滤,那么就需要基于相似度的查询,而不是原来的精确数值比较,全文索引就是为这种场景设计的。
25666 0
阿里云云原生一体化数仓正式发布  助力企业数据驱动业务创新
云原生一体化数仓是集阿里云大数据产品MaxCompute、DataWorks、Hologres三种产品能力于一体的一站式大数据处理平台。核心是3个一体化和全链路数据治理能力,包括离线实时一体、湖仓一体、分析服务一体、全链路数据治理。
1598 0
全面公测|Grafana服务:一张图表胜过千行指标&日志
Grafana 帮助运维人员轻松处理各类运维过程中遇到的各类数据可视化与分析难题。目前阿里云 Grafana 服务全面免费公测,帮助企业轻松构建运维数据可视化平台,轻松实现数据驱动运维!
1142 0
一起学Golang系列(五)初次接触Go语言可能遇到的各种坑!
前面介绍了Go语言的基础语法,所谓磨刀不误砍柴工,希望大家还是能熟悉掌握这些基础知识,这样后面真正学起Go来才会得心应手。 作为初学者。Go语言的语法有些和java类似,但也有很多不一样的地方。刚开始都会遇到各种各样的坑。下面就来总结下学习go语言的过程中,遇到的各种坑。
1009 0
设备接入--海康摄像头SDK
springboot-对接海康摄像头,兼容window和Linux环境
1327 0
Flink SQL 在快手的扩展和实践
快手实时计算团队技术专家张静、张芒在 FFA 2021 的分享
1135 0
无影云桌面,企业与个人的应用神器
阿里云无影云桌面( Elastic Desktop Service)的原产品名为弹性云桌面,融合了无影产品技术后更名升级。它可以为您提供易用、安全、高效的云上桌面服务,帮助您快速构建、高效管理桌面办公环境,提供安全、灵活的办公体系。
276281 0
+关注
袋鼠云艾迪
萌新路过
7
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载