湖北阿里云授权服务中心分析云服务器CPU跑满或跑高排查问题

简介: 相信很多客户在使用云服务器ECS时,若出现服务的速度变慢,或ECS实例突然断开。这种情况我们一般考虑服务器带宽和CPU是否有跑满或跑高的问题。若您预先创建报警任务,当带宽和CPU跑满或跑高时,系统将自动进行报警提醒。
    相信很多客户在使用云服务器ECS时,若出现服务的速度变慢,或ECS实例突然断开。这种情况我们一般考虑服务器带宽和CPU是否有跑满或跑高的问题。若您预先创建报警任务,当带宽和CPU跑满或跑高时,系统将自动进行报警提醒。  

下面就由阿里云湖北授权服务中心武汉捷讯信息技术的小编给大家普及一下怎么排查CPU跑满或跑高的问题。

Windows系统下,您可以按如下步骤进行排查:

1.定位问题。找到影响带宽和CPU跑满或跑高的具体进程。

2.分析处理。排查影响带宽和CPU跑满或跑高的进程是否正常,并分类进行处理:

1)对于正常进程:您需要对程序进行优化或者升级服务器配置。

2)对于异常进程:您可以手动对进程进行查杀,也可以让使用第三方安全工具去查杀。

1.定位问题

微软有多个工具可以定位CPU和带宽跑满或跑高的问题,例如任务管理器,资源监视器(ResourceMonitor),性能监视器(PerformanceMonitor),ProcessExplorer,Xperf(Windowsserver2008以后),抓取系统FullMemoryDump检查。在流量大的情况下,您还可以使用Wireshark抓取一段时间的网络包,分析流量使用情况。

注意:Windows2008版以上,通常使用系统自带的资源监视器监控CPU和带宽。

1.1操作步骤

1.在桌面底部单击开始菜单,选择运行。

2.打开运行框后,在框中输入perfmon-res并单击确定。

03164743hfdf

3.在资源监视器页面中,查看各进程是否有CPU或带宽跑满/跑高的现象。
031648048jtm

4.针对占用资源较高的进程,查看对应的进程ID和进程的程序名。

5.定位进程ID后,结合任务管理器判断程序是否异常并定位程序的具体位置。

i.定位异常进程前,需要在任务管理器中选择查看(V)>选择列(S)…。
03164939ksuz

ii.在弹出的框中选择PID(进程标识符),单击确定。
0316500435x8

iii.任务管理器的进程页面中,将会增加PID这一项。

iv.单击PID项,通过排序,找到之前资源监视器查看到的异常进程。右击进程名称,选择打开文件位置,定位进程是不是恶意程序。
03165031kvi8

2.CPU和带宽跑满或跑高的分析处理

您需要判断影响CPU和带宽跑满或跑高的进程,属于正常进程还是异常进程,并分类进行处理。

2.1正常跑满或跑高的分析处理

正常情况下,当客户频繁访问业务,或由于Windows自身服务(更新服务等)都可能会占用较高网络流量和CPU。针对正常进程导致的CPU和带宽跑满或跑高的情况,请按照如下顺序逐一进行排查。

注意:Windows2008/Windows2012服务器建议内存配置在2G或者2G以上。

1.检查后台是否有执行WindowsUpdate的行为。

2.建议在服务器上安装杀毒软件,进行杀毒。如有安装杀毒软件,请检查CPU或带宽飙高时,杀毒软件是否在后台执行扫描操作。如果可能,请升级杀毒软件到最新版本,或者删除杀毒软件。

3.检查该ECS内应用程序是否有大量的磁盘访问/网络访问行为/高计算需求。通过尝试增配实例规格的方式,使用更多核数/内存的规格来解决资源瓶颈问题,如升级宽带。

4.若自身服务器配置较高,再去升级配置已经没有太大意义。架构方面也并非是服务器配置越高就越好。此时,您需要尝试进行应用分离,同时对相关程序进行优化。示例说明如下:

问题描述:当一个服务器上面同时部署了MySQL,PHP,Web等多种应用,即使配置比较高,也很容易出现资源负载异常。

解决方法:尝试应用分离,通过不同的服务器去承载不同的应用。比如数据库完全通过RDS来承载,减轻服务器本身的资源消耗和服务器内部大量的调用。而程序优化方面,您可以根据自身的配置状况进行调整,比如调整连接数和缓存配置,以及Web和数据库调用时的各项参数等。

2.2异常跑满或跑高的分析处理

对于CPU和带宽异常跑满或跑高的情况,可能是被恶意病毒、木马入侵导致的。有时三方恶意程序可能会利用操作系统的svchost.exe,或者Tcpsvcs.exe来伪装,引起高带宽的占用。您需要手动对异常进程进行查杀。

注意:若您无法判断进程是否为病毒或木马,建议将进程名称在网上进行搜索后确认。另外,建议您进行进程删除操作前,提前创建快照完成备份。使用商业版杀毒软件,或使用微软免费安全工具MicrosoftSafetyScanner,在安全模式下进行扫描杀毒。

1.运行WindowsUpdate来安装最新的微软安全补丁。

2.使用MSconfig禁用所有非微软自带服务驱动,检查问题是否再次发生,具体请参考:如何在Windows中执行干净启动。

3.若服务器或站点遭受DDOS攻击或CC攻击等,短期内产生大量的访问需求。您可以登录阿里云管理控制台,查看云盾中的防护DDOS攻击是否调整好阈值,并核实是否开启CC防护。如果攻击没有触发到阈值,云盾没有清洗,可以联系售后协助开起清洗。

3.底层资源问题

若由于底层资源问题,导致服务器带宽和CPU跑满或跑高,请提交工单向售后寻求技术支持,对底层资源问题进行检测分析。

好了,今天的分享就到这里了,下次小编在给大家分享其他的问题。如果大家还有其他的疑问可以浏览我们的官网武汉捷讯信息技术看能否找到答案呢!
相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2天前
|
弹性计算 人工智能 Serverless
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。
|
4天前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
89 1
|
14天前
|
机器学习/深度学习 弹性计算 缓存
阿里云服务器经济型e实例与通用算力型u1实例对比分析与选择指南
在阿里云服务器的实例规格中,经济型e实例和通用算力型u1实例是很多个人和普通企业级用户常见的选择,经济型e实例与通用算力型u1实例的主要区别在于性能、应用场景及价格策略。本文将详细对比这两种实例的性能、应用场景及价格策略,以供参考。
|
27天前
|
人工智能 运维 Kubernetes
87cloud案例分析:阿里云国际服务器如何支持在线教育
87cloud案例分析:阿里云国际服务器如何支持在线教育
|
25天前
|
弹性计算 安全 Linux
阿里云国际版ECS云服务器ping不通的原因分析
阿里云国际版ECS云服务器ping不通的原因分析
|
1月前
|
缓存 监控 负载均衡
提高服务器CPU使用率
提高服务器CPU使用率
78 7
|
1月前
|
存储 缓存 监控
如何提高服务器CPU性能?
如何提高服务器CPU性能?
102 3
|
2月前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
110 5
|
17天前
|
域名解析 弹性计算 缓存
阿里云国际云服务器全局流量分析功能详细介绍
阿里云国际云服务器全局流量分析功能详细介绍
|
2月前
|
存储 安全 算法
服务器数据恢复—Raid磁盘阵列的安全性分析及常见故障
出于尽可能避免数据灾难的设计初衷,RAID解决了3个问题:容量问题、IO性能问题、存储安全(冗余)问题。从数据恢复的角度讨论RAID的存储安全问题。 常见的起到存储安全作用的RAID方案有RAID1、RAID5及其变形。基本设计思路是相似的:当部分数据异常时,可通过特定算法将数据还原出来。以RAID5为例:如果要记录两个数字,可以通过再多记录这两个数字的和来达到记录冗余性的目的。例如记录3和5,同时再记录这2个数字的和8。在不记得到底是几和5的情况下,只需要用8-5就可以算出这个丢失的数字了,其余情况依此类推。

热门文章

最新文章