云计算简介-阿里云开发者社区

开发者社区> 袋鼠云艾迪> 正文

云计算简介

简介: 云计算简介: 云计算:一群提供服务的计算机的整体 提供服务(通信网络) 云服务:用户按需消费、使用 云计算运维做什么: 7*24 小时快速响应 故障处理 备份恢复 系统安全 软件部署 监控报警 架构调优 统计分析 脚本开发(自动化) 发展方向: 资深运.
+关注继续查看

云计算简介:
云计算:一群提供服务的计算机的整体
提供服务(通信网络)
云服务:用户按需消费、使用
云计算运维做什么:
7*24 小时快速响应
故障处理
备份恢复
系统安全
软件部署
监控报警
架构调优
统计分析
脚本开发(自动化)

发展方向:
资深运维工程师
运维平台研发工程师
数据库工程师
运维总监
架构师

系统运维工程师:基础设施部署、应用环境部署、与开发协作更新应用版本、性能监控、容 量规划、备份、响应处理运维故障、优化系统性能、改善自身运维方法流程

常用的开源软件:

操作系统:centos,ubantu
网站:nginx,php-fpm,tomcat
关系型数据库:mysql nosql:redis,mongodb
代理:lvs,keepalived,haproxy
版本控制:gitlab
监控:zabbix
批量管理:ansible
打包工具:jenkins
日志分析:ELK(ElasticSearch+Logstash+Kibana)
脚本语言:shell,python

故障解决思路:
1.根据故障现象判断故障产生的影响,确定优先级
2.尽快恢复服务
a) 服务出错、假死:重启服务
b) 版本问题:保存日志待查,回滚版本
c) 资源不足:暂时关闭次要服务、紧急扩容
3.定位故障原因:
配置、版本是否变更
查看日志
4.后续完善响应监控
5.制定应急方案

运维的分类

系统运维:管理服务器、基础服务搭建、负载均衡、高可用、CDN、系统优化 
桌面运维:管理客户端、企业桌面维护、办公设备维护、网络维护
网络运维:管理网络设备、服务器上架、硬件设备故障监控、设备保修 
应用运维:参与产品设计、应用部署上线、版本更新、应用故障处理
运维研发:运维平台开发、基础设施开发(中间件、维护软件)、自动化运维 
数据库运维:数据库设计、优化、监控、备份、灾备
运维安全:制定安全制度、安全培训、风险评估、漏洞检测

服务器:能够为其他计算机提供服务的更高级的电脑(更加稳定、高效)

分类:机架式、塔式、机柜式、刀片式 

选择服务器的指标:

1.需求决定一切,着眼未来
2.不要贪图便宜,电费远比你想象的贵 
3.机房中的空间是稀缺资源,机架式比塔式性价比更高 
4.管理方便:比如螺丝少、支持远程控制 
5.硬件通用性好,尤其是驱动
6.厂商支持
7.可替代产品是否广泛
8.在一定规模范围内,云主机的性价比更高 
服务器尺寸:1U≈4.445 厘米
机柜容量:22U、37U、42U(主流) 
网络设备机柜:600 或 800mm 
服务器机柜:900 或 1000mm 
选型参数:
  支持的 CPU 颗数、CPU 核心数
  内存插槽数(最少 24 个)、最大支持内存容量 
  硬盘接口(服务器:SAS,家用机:SATA)、盘架个数、最大支持硬盘容量 
  RAID 卡支持级别、RAID 卡电池
  电源数量、整机功率

典型服务模式(C/S:Client/Server 架构):

服务器:提供资源或某种功能
客户机:使用资源、功能

架构方式:

1.SMP 服务器:主要特征是共享。系统中所有的资源(例如:CPU、内存、I/O 等)都是 共享的。扩展能力有限,最受限制的是内存,当 CPU 数量增多时,会导致内存紊乱,降低 CPU 效率。效率最高的 CPU 数量是 2~4 个
2.NUMA 服务器:主要特征是具有多个 CPU 模块,每个 CPU 模块由多个 CPU 组成,并且 具有独立的内存、I/O 等。当需要运行大内存应用时,需要向其他模块借调内存 

CPU 选择:

1.主要指标有缓存、主频、核心数量,服务器的 CPU 一般都是 XEON 
2.CPU 物理核心数量越多,并发行越强,不包括超线程。超线程在 CPU 密集型计算, 高负载的时候没有任何效果,甚至还会拖慢系统速度 
3.CPU 主频越高单次计算速度就越快 
4.CPU 缓存大的性能好 
5.不同主频的内存不要混插
6.多通道的一定要按组接入,多 CPU 的按组对称分布,一般主板内存槽同组都会标示 相同的颜色 
7.RAID 卡很重要,带高速缓存的好,带备用电池单元的好,硬 RAID 卡(自带数据存 储和专用 CPU)比软 RAID 卡好 

硬盘选择:

1.硬盘转速
2.做 RAID 不能混用 
3.SSD 在随机 I/O 读写上性能非常好 
4.在格式化 SSD 分区的时候要注意对齐,影响 I/O 速度 
5.在内核队列上选择 NOOP 效果比较好 
功耗:如果选配的最大功耗大于电源模块的最大输出就需要考虑购买多个电源模块。电源不 考虑冗余
基于智能平台管理接口(IPMI:Intelligent Platform Management Interface)协议的服务 器带外管理工具
让用户通过网络来监控服务器上各种硬件组件的健康状况,如 CPU 电压、风扇转速、系 统温度、功耗等,开放的免费标准 
DELL 的管理命令:IPMITOOL 
DELL 工具名称:iDRAC
参数:-U 登陆用户名 
  -P 登陆密码
  -H 远程主机地址
  -power 电源管理模块 
  -sel 硬件日志管理 
  -sol 串口重定向

网络设备选型:

交换机:端口数量、端口速率、背板带宽、POE 供电(有源以太网) 
路由器:内存、flash、协议支持、模块扩展

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
怎么设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程
6935 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
4503 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
7768 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
9435 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
5466 0
腾讯云服务器 设置ngxin + fastdfs +tomcat 开机自启动
在tomcat中新建一个可以启动的 .sh 脚本文件 /usr/local/tomcat7/bin/ export JAVA_HOME=/usr/local/java/jdk7 export PATH=$JAVA_HOME/bin/:$PATH export CLASSPATH=.
2147 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
16851 0
+关注
袋鼠云艾迪
萌新路过
3
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载