开发者社区> 袋鼠云艾迪> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

云计算简介

简介: 云计算简介: 云计算:一群提供服务的计算机的整体 提供服务(通信网络) 云服务:用户按需消费、使用 云计算运维做什么: 7*24 小时快速响应 故障处理 备份恢复 系统安全 软件部署 监控报警 架构调优 统计分析 脚本开发(自动化) 发展方向: 资深运.
+关注继续查看

云计算简介:
云计算:一群提供服务的计算机的整体
提供服务(通信网络)
云服务:用户按需消费、使用
云计算运维做什么:
7*24 小时快速响应
故障处理
备份恢复
系统安全
软件部署
监控报警
架构调优
统计分析
脚本开发(自动化)

发展方向:
资深运维工程师
运维平台研发工程师
数据库工程师
运维总监
架构师

系统运维工程师:基础设施部署、应用环境部署、与开发协作更新应用版本、性能监控、容 量规划、备份、响应处理运维故障、优化系统性能、改善自身运维方法流程

常用的开源软件:

操作系统:centos,ubantu
网站:nginx,php-fpm,tomcat
关系型数据库:mysql nosql:redis,mongodb
代理:lvs,keepalived,haproxy
版本控制:gitlab
监控:zabbix
批量管理:ansible
打包工具:jenkins
日志分析:ELK(ElasticSearch+Logstash+Kibana)
脚本语言:shell,python

故障解决思路:
1.根据故障现象判断故障产生的影响,确定优先级
2.尽快恢复服务
a) 服务出错、假死:重启服务
b) 版本问题:保存日志待查,回滚版本
c) 资源不足:暂时关闭次要服务、紧急扩容
3.定位故障原因:
配置、版本是否变更
查看日志
4.后续完善响应监控
5.制定应急方案

运维的分类

系统运维:管理服务器、基础服务搭建、负载均衡、高可用、CDN、系统优化 
桌面运维:管理客户端、企业桌面维护、办公设备维护、网络维护
网络运维:管理网络设备、服务器上架、硬件设备故障监控、设备保修 
应用运维:参与产品设计、应用部署上线、版本更新、应用故障处理
运维研发:运维平台开发、基础设施开发(中间件、维护软件)、自动化运维 
数据库运维:数据库设计、优化、监控、备份、灾备
运维安全:制定安全制度、安全培训、风险评估、漏洞检测

服务器:能够为其他计算机提供服务的更高级的电脑(更加稳定、高效)

分类:机架式、塔式、机柜式、刀片式 

选择服务器的指标:

1.需求决定一切,着眼未来
2.不要贪图便宜,电费远比你想象的贵 
3.机房中的空间是稀缺资源,机架式比塔式性价比更高 
4.管理方便:比如螺丝少、支持远程控制 
5.硬件通用性好,尤其是驱动
6.厂商支持
7.可替代产品是否广泛
8.在一定规模范围内,云主机的性价比更高 
服务器尺寸:1U≈4.445 厘米
机柜容量:22U、37U、42U(主流) 
网络设备机柜:600 或 800mm 
服务器机柜:900 或 1000mm 
选型参数:
  支持的 CPU 颗数、CPU 核心数
  内存插槽数(最少 24 个)、最大支持内存容量 
  硬盘接口(服务器:SAS,家用机:SATA)、盘架个数、最大支持硬盘容量 
  RAID 卡支持级别、RAID 卡电池
  电源数量、整机功率

典型服务模式(C/S:Client/Server 架构):

服务器:提供资源或某种功能
客户机:使用资源、功能

架构方式:

1.SMP 服务器:主要特征是共享。系统中所有的资源(例如:CPU、内存、I/O 等)都是 共享的。扩展能力有限,最受限制的是内存,当 CPU 数量增多时,会导致内存紊乱,降低 CPU 效率。效率最高的 CPU 数量是 2~4 个
2.NUMA 服务器:主要特征是具有多个 CPU 模块,每个 CPU 模块由多个 CPU 组成,并且 具有独立的内存、I/O 等。当需要运行大内存应用时,需要向其他模块借调内存 

CPU 选择:

1.主要指标有缓存、主频、核心数量,服务器的 CPU 一般都是 XEON 
2.CPU 物理核心数量越多,并发行越强,不包括超线程。超线程在 CPU 密集型计算, 高负载的时候没有任何效果,甚至还会拖慢系统速度 
3.CPU 主频越高单次计算速度就越快 
4.CPU 缓存大的性能好 
5.不同主频的内存不要混插
6.多通道的一定要按组接入,多 CPU 的按组对称分布,一般主板内存槽同组都会标示 相同的颜色 
7.RAID 卡很重要,带高速缓存的好,带备用电池单元的好,硬 RAID 卡(自带数据存 储和专用 CPU)比软 RAID 卡好 

硬盘选择:

1.硬盘转速
2.做 RAID 不能混用 
3.SSD 在随机 I/O 读写上性能非常好 
4.在格式化 SSD 分区的时候要注意对齐,影响 I/O 速度 
5.在内核队列上选择 NOOP 效果比较好 
功耗:如果选配的最大功耗大于电源模块的最大输出就需要考虑购买多个电源模块。电源不 考虑冗余
基于智能平台管理接口(IPMI:Intelligent Platform Management Interface)协议的服务 器带外管理工具
让用户通过网络来监控服务器上各种硬件组件的健康状况,如 CPU 电压、风扇转速、系 统温度、功耗等,开放的免费标准 
DELL 的管理命令:IPMITOOL 
DELL 工具名称:iDRAC
参数:-U 登陆用户名 
  -P 登陆密码
  -H 远程主机地址
  -power 电源管理模块 
  -sel 硬件日志管理 
  -sol 串口重定向

网络设备选型:

交换机:端口数量、端口速率、背板带宽、POE 供电(有源以太网) 
路由器:内存、flash、协议支持、模块扩展

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
目标检测简介
目标检测任务主要包含两个子任务,一个是输出这类目标的类别信息,属于分类任务;另一个是输出目标的具体位置信息,属于定位任务。
59 0
云计算对未来生活的影响|学习笔记
快速学习 云计算对未来生活的影响
99 0
云计算
云计算简单描述
393 0
云计算最大难处
本文讲的是云计算最大难处,云计算最终将证明是推动虚拟桌面快速增长的实现技术吗?根据最近推广虚拟桌面基础设施解决方案的情况判断,这似乎是一个希望。
1146 0
云计算是什么意思
本文讲的是云计算是什么意思,初次听到云计算这个概念的时候,很多朋友都会问同一句话,就是云计算是什么意思。关于云计算有很多争议,也有很多的定义。到底云计算是什么意思?我们来从各方面做个介绍,从个层面上了解一下云计算的概念。世界上现在云计算的先行者有好几家,在云计算方面可以说是各显神通。
2568 0
风起云涌“云计算”
本文讲的是风起云涌“云计算”,所谓云计算,是一种分布式计算技术,其最基本的概念,是透过网络将庞大的计算处理程序分拆成无数个较小的子程序,再交给由多个服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。云计算使得普通用户借助网络也能够享受类似超级计算机的强大能力。
1534 0
云效平台简介
云效,创立于2012年,是由阿里巴巴出品,是业内领先的面向企业的一站式研发效能平台,以提升研发效能为目标,通过线上化,透明化和自动化打通产品质量闭环,真正实现了持续集成持续交付。
11632 0
DOD发布三款云计算安全标准
http://iase.disa.mil/cloud_security/Pages/index.aspx
859 0
+关注
袋鼠云艾迪
萌新路过
7
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载