• 云服务器 ECS 监控:使用云监控监控ECS实例

    CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将cpu告警阈值设置为70%,连续三次超过阈值后开始报警。如下图所示点击添加报警规则继续设置内存和磁盘的报警规则和报警通知人即可...
    文章 2017-08-15 4181浏览量
  • 系统稳定性——So Hot?快给 CPU 降降温!

    CPU 涵盖的问题场景有很多,限于篇幅限制,下面以最常见的用户态 CPU 使用率高为例,介绍下 Java 应用的排查思路,其他场景留待后续分享,推荐阅读《如何迅速分析出系统CPU的瓶颈在哪里?如何排查用户态 CPU 使用率...
    文章 2019-08-26 952浏览量
  • 《构建高可用VMware vSphere 5.X虚拟化架构》——第1...

    作者觉得SSD硬盘的价格降低后,可能逐渐成为主流,但不能忽视由于使用闪存芯片,SSD硬盘出现故障修复是相当低的。1.1.4 物理服务器阵列卡的选择服务器所使用的阵列卡种类繁多,其质量参差不齐,VMware官方为保证...
    文章 2017-05-02 1708浏览量
  • 重启大法好!线上常见问题排查手册

    CPU 使用率的安全值没有一个标准值,取决于你的系统是计算密集型还是 IO 密集型,一般计算密集型应用 CPU 使用率偏高 load 偏低,IO 密集型相反。问题原因及定位: 1 频繁 FullGC/YongGC 查看 gc 日志 jstat-gcutil ...
    文章 2020-04-27 7767浏览量
  • 基于机器学习的内存故障预测了解一下|双11备战

    状态信息包括服务器负载,CPU使用率,内存使用率,缓存使用率,磁盘使用率,流入流出流量,CPU温度,内存温度,内存功耗,总功耗等,可以反应出服务器的整体运行状态。状态信息都是时间序列数据,每分钟都在变化。...
    文章 2019-07-31 1633浏览量
  • 宽带路由器常见故障排除技巧

    宽带路由器常见故障排除技巧带路由器在企业网络中的应用是相当广泛的,在运行的过程中出现故障是在所难免的,虽然故障现象多种多样,引起故障发生的原因也不尽相同,但从大体上可以把这些故障分为硬件故障和软件故障...
    文章 2017-11-27 888浏览量
  • Vmware vSphere常见问题汇总(七)

    n 将主机上或资源池中其他虚拟机的 CPU 使用情况与此虚拟机的 CPU 使用情况值进行比较。主机的虚拟机视图上的堆栈条形图显示主机上所有虚拟机的 CPU 使用情况。n 确定虚拟机就绪时间过长是否由其 CPU 使用...
    文章 2017-11-14 1200浏览量
  • 服务器可靠性提升(一)内存CE增强隔离技术

    ——当检测到系统的内存出现一些轻微的故障的时候,我们通过基于出错存储单元物理位置的相关性,统计出错单元的故障频度和故障数变化使用基本的漏桶算法加上人工智能的自学习算法,来评估这个故障会不会恶化,...
    文章 2019-07-31 3113浏览量
  • 《CCNP TSHOOT 300-135认证考试指南》——2.4节利用...

    此外,在show processes cpu命令中使用参数sorted,能够按5秒钟、1分钟、5分钟利用进行排序,因而可以按照降序方式显示最消耗CPU资源的进程。与在命令中使用include选项进行输出过滤一样,也可以使用exclude选项...
    文章 2017-05-02 1135浏览量
  • 优化 SQL Server CPU 性能

    对于 SQL Server 系统,DBMS 实际上处理自己的极其有效的操作系统队列和线程,因此,超线程仅在 CPU 利用已经很高、系统上的物理 CPU 超载的情况下使用。当 SQL Server 在多个计划程序上对执行任务请求进行排队时...
    文章 2017-06-25 1125浏览量
  • 这可能是史上最全 Redis 高可用解决方案总结

    本文主要针对 Redis 常见的几种使用方式及其优缺点展开分析。一、常见使用方式 Redis 的几种常见使用方式包括: 1.Redis 单副本;2.Redis 多副本(主从);3.Redis Sentinel(哨兵);4.Redis Cluster;5.Redis 自研...
    文章 2018-09-29 2942浏览量
  • 性能专题:一文搞懂性能测试常见指标

    CPU指标主要指的CPU利用,包括用户态(user)、系统态(sys)、等待态(wait)、空闲态(idle)。CPU 利用要低于业界警戒值范围之内,即小于或者等于75%;CPU sys%小于或者等于30%;CPU wait%小于或者等于5%;4.2 内存 ...
    文章 2019-11-04 1641浏览量
  • 这可能是史上最全 Redis 高可用解决方案总结

    本文主要针对 Redis 常见的几种使用方式及其优缺点展开分析。一、常见使用方式 Redis 的几种常见使用方式包括: Redis 单副本;Redis 多副本(主从);Redis Sentinel(哨兵);Redis Cluster;Redis 自研。二、各种...
    文章 2018-09-30 1536浏览量
  • RAID 独立磁盘真阵列

    RAID技术主要包含RAID 0~RAID 50等数个规范,它们的侧重点各不相同,常见的规范有如下几种: RAID 0:RAID 0连续以位或字节为单位分割数据,并行读/写于多个磁盘上,因此具有很高的数据传输,但它没有数据冗余,...
    文章 2012-08-29 951浏览量
  • 不想备案所以想买个香港服务器,听说香港的比较慢?

    随着香港服务器市场普及增高,香港服务器使用过程中出现的问题也让更多企业和朋友感到烦恼,某些用户在使用香港服务器时可能感觉网络速度变慢,变卡等状况。那么哪些因素会导致香港服务器速度慢呢?阿里云在此为您...
    文章 2018-12-19 2606浏览量
  • 不想备案所以想买个美国主机,听说美国的比较慢?

    随着美国主机市场普及增高,美国主机使用过程中出现的问题也让更多企业和朋友感到烦恼,某些用户在使用美国主机时可能感觉网络速度变慢,变卡等状况。那么哪些因素会导致美国主机速度慢呢?阿里云在此为您作简单...
    文章 2018-12-19 1238浏览量
  • Oracle数据库运维场景下,智能运维如何落地生根?

    实例基础性能数据包括业务的QPS、TPS,实例和主机的CPU使用率、内存使用率、连接数使用率,SQL解析情况,数据库的逻辑读、物理读,数据库锁等待状况,以及RAC集群间的通信状况。Oracle等待事件采集Oracle内部等待...
    文章 2020-08-11 196浏览量
  • Oracle数据库运维场景下,智能运维如何落地生根?

    实例基础性能数据包括业务的QPS、TPS,实例和主机的CPU使用率、内存使用率、连接数使用率,SQL解析情况,数据库的逻辑读、物理读,数据库锁等待状况,以及RAC集群间的通信状况。Oracle等待事件采集Oracle内部等待...
    文章 2020-03-25 1242浏览量
  • 优云蒋君伟:运维监控大数据的提取与分析

    通过将一些技术组件的CPU利用率在一个趋势图中显示,我们可以利用指标间的正相关性,来分析组件间的影响,比如档案服务的CPU利用率升高时,提供其数据的Redis服务CPU使用率也在升高。其解题思路为:分别为每种服务...
    文章 2016-11-14 3696浏览量
  • 10 人,2 个月|虾米音乐的监控体系升级之路

    因此我们使用成功、RT 和错误码三个指标来进行一个接口的故障监控。特别指出的是,对于客户端接口的 RT 监控上,我们没有使用平均 RT,而是使用 Top 75%RT。因为想用它来反应用户侧的感受,比如 RT的 75%分位线...
    文章 2019-08-22 2275浏览量
  • 第6章 TCP/IP路由协议故障处理

    高的CPU利用 1)不稳定的路由更新2)没有关闭debug3)进程过重 路由触发活跃模式 1)不一致的间隔2)硬件问题3)不稳定的链路 十、TCP/IP症状和行动计划 问题 行动计划 DNS工作不正常 1)配置DNS主机的配置和DNS...
    文章 2017-11-21 864浏览量
  • MySQL服务进程占用系统CPU达100%

    故障现象:ping云主机严重丢包,丢包达99%,仅有一两个包可到达;更无法远程;排查:云主机 CentOS6.4 后台查看CPU占用高达99%还好能登入系统,操作也并不卡顿;top查看 mysql服务进程占用CPU达100% 如图: 两分钟...
    文章 2017-12-02 3479浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    这些关键的数据进入到MaxCompute进行数据挖掘,来预测某个对象下一个状态(故障)的发生概率,同时也会根据挖掘的结果来调整Checker的规则和参数,以提高故障检测的准确常见的场景 华佗目前已能够处理主流硬件和...
    文章 2016-12-18 4692浏览量
  • 《深入学习VMware vSphere 6》——1.2 虚拟化应用概述

    在实际实施虚拟化的项目中,大多数虚拟机对CPU的要求并不是非常高,即使为虚拟机分配了4个或更多的CPU,但实际上该虚拟机的CPU使用率只有10%以下,这时候所消耗的物理主机CPU资源不足0.5个。如图1-2-2所示,这是使用...
    文章 2017-05-02 3904浏览量
  • 如何运用结构化思维进行故障处理

    CPU使用率 磁盘空间 IO使用率 SWAP使用情况 DB指标 数据库存活 连接数 慢SQL 主从延迟 2)故障定位 检查操作 程序发布 在线表变更 在线数据修改 后台任务、数据统计 数据库参数调整 其他误操作 检查OS 系统进程 CPU ...
    文章 2019-10-15 5188浏览量
  • Redis企业集群工具RLEC

    如果集群所有节点的CPU利用小于20%,则集群需要进行横向收缩,直到最小集群要求(3节点) 3)节点的内存至少是15GB,建议30GB以上 如果集群部分节点的内存利用大于80%,则集群进行重新平衡 如果集群所有节点的...
    文章 2016-01-20 881浏览量
  • 这可能是目前最全的Redis高可用技术解决方案总结

    本文主要针对Redis常见的几种使用方式及其优缺点展开分析。一、常见使用方式 Redis的几种常见使用方式包括: Redis单副本;Redis多副本(主从);Redis Sentinel(哨兵);Redis Cluster;Redis自研。二、各种使用...
    文章 2018-08-21 19460浏览量
  • 闲鱼神探——线上问题定位与快速解决

    指标:指监控对象本身携带的监控特征,例如,系统负载(Load)、CPU利用率、内存使用率、网络I/O、磁盘利用率、服务是否超时、日志特点。规则:指构建决策逻辑的最小单位,由指标和逻辑组成。知识库:指专家经验的...
    文章 2020-07-28 1455浏览量
  • Linux 问题故障定位,看这一篇就够了

    处理器●核●硬件线程●CPU内存缓存●时钟频率●每指令周期数CPI和每周期指令数IPC●CPU指令●使用率●用户时间/内核时间●调度器●运行队列●抢占●多进程●多线程●字长 4.2 分析工具 说明: uptime,vmstat,mpstat...
    文章 2018-11-14 2869浏览量
  • Node.js 应用故障排查手册 —— 大纲与常规问题指标...

    一般来说,对于 CPU 很高 Node.js 进程,我们可以使用 Node.js 性能平台 提供的 CPU Profiling 工具来在线 Dump 出当前的 Javascript 运行情况,进而找到热点代码进行优化,具体在本书第二部分会有更详细地说明。...
    文章 2019-03-23 1270浏览量
1 2 3 4 ... 16 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化