• 关于

    服务器告警

    的搜索结果
  • Zabbix 服务器性能指标参考(学习笔记十七)

    服务器性能及业务监控指标,可根据实际情况调整,下表供大家参考。 监控类别监控子对象监控维度监控指标警告严重 服务器CPU负载1分钟采集,5分钟告警>=5>=10 利用率1分钟采集,5分钟告警>=60%>=80% 温度1分钟采集,5分钟告警>=70℃>=80℃ 内...

    文章 sktj 2018-04-04 982浏览量

  • 云监控之运维篇

    一、服务器的日常监控 1.1 遇到的潜在问题 随着公司的发展,公司的业务量不断的增加,网站的访问量越来越大,如何快速定位到系统的性能瓶颈,有针对性地提升硬件性能,为企业优化信息平台的投入成本呢? 1.2 云监控如何解决 1.2.1 总体思路: 首先,需要安装云监控的插件;然后,对服...

    文章 bbskkb 2018-04-13 1742浏览量

  • 浅谈SCOM Agent的心跳响应机制

         前段时间在某论坛中看到有网友问SCOM能否监测到服务器宕机,是怎么样一个工作过程?今天我将给大家讲述这方面的内容,在SCOM中监测服务器宕机主要涉及心跳信号这部分内容,SCOM服务器和Agent之间是有心跳信号通讯的。默认情况下,SCOM Agent每60秒会发送一次心跳信号给SCOM ...

    文章 技术小甜 2017-11-16 902浏览量

  • System center 2012 R2 实战十、妙用SCO+SCOM实现声音告警

         SCOM默认支持邮件告警,即时消息告警,短信告警,那么如果要实现声音告警,应该如何实现呢?大家可以好好思考一下,需求就是SCOM产生警报,同时触发声音告警+短信告警+邮件报警。      当时第一个想到的是Live Maps,Live Maps是一个单独的收费产品,通过Live Map...

    文章 科技小能手 2017-11-12 1088浏览量

  • 阿里云TAC报警中心功能特点与适用场景

    TAC报警中心是阿里云SRE团队为专有云精心打造的一站式告警运维平台,覆盖专有云所涉及的云产品、大数据、云实例以及用户所涉及的站点应用等告警,提供告警生命周期管理以及报警外发等解决方案。帮助专有云快速发现、定位异常问题,协助产品团队进行产品优化。 1 功能特点 1.1 告警汇聚 默认集成:云平台...

    文章 游客hnajkmzjrkff2 2020-09-27 129浏览量

  • 重启能解决服务器宕机的问题吗?

    服务器在长时间连续运作时,有可能因为软件问题或硬件问题导致宕机,这个一般idc商都会监控托管服务器的机器状况,向用户配置的告警接收人推送告警信息。   1. 用户收到告警后,需要在管理中心中重启相关的服务器来解决问题,以尽快恢复业务。 2. 如果在管理中心中重启机器不生效,可以尝试在服务器上以ro...

    文章 晚来风急 2017-07-03 757浏览量

  • Replication-Replication Distribution Subsystem: agent xxxxxx failed. Column names in each table must be unique

      最近遇到一个关于发布订阅(Replication)的奇葩问题,特此记录一下这个案例。我们一SQL SERVER数据库服务器出现大量告警。告警信息如下所示: DESCRIPTION: Replication-Replication Distribution Subsystem: agent x...

    文章 潇湘隐者 1970-01-01 500浏览量

  • SQL Server数据库告警改进

     考虑对生产环境所有SQL Server服务器开启数据库邮件功能,它是数据库自带的邮件发送功能,通过配置到邮件服务器的访问,及时接收SQL Server事件告警。   SQL Server警报是基于引擎的事件通知机制发送告警,当事件发生时出发告警通知。     现阶段,需要收集如下两类SQL...

    文章 技术小甜 2017-11-15 867浏览量

  • 【X-Pack解读】阿里云Elasticsearch X-Pack 告警组件功能详解

    X-Pack Alerting CPU 使用率意外增加, 应用响应时间激增;503 错误的数量火箭式上升;Elasticsearch 索引率直线下降。尽管情况层出不穷,但是您可以通过X-Pack的告警组件Alerting发送您所需的警报,让您随时随刻掌握应用情况。检测数据变化 X-Pack 中的 ...

    文章 工程师甲 2017-12-05 5163浏览量

  • RedAlert简介

    RA简介 RedAlert(一下简称RA)是神马搜索引擎团队打造的一个基于指标的监控服务,它从类似ganglia或graphite这样的数据源获取指标,并在指标异常的时候通过邮件发送告警 RA服务由两部分组成 RAServer: 执行指标检测,发送告警的服务主体 RAWeb: 本服务提供的web...

    文章 jionghang.caijh 2017-04-28 1597浏览量

  • ORACLE告警日志文件

    告警日志介绍   告警日志文件是一类特殊的跟踪文件(trace file)。告警日志文件命名一般为alert_<SID>.log,其中SID为ORACLE数据库实例名称。数据库告警日志是按时间顺序记录message和错误信息。   告警日志位置 在ORACLE 10...

    文章 潇湘隐者 2016-04-26 1906浏览量

  • 有效运维的 on-call 机制

    [编者按]本文作者为陈伯龙,云告警平台OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。 正文 互联网技术的发展,离不开运维支撑工作,没有零bug的程序,没有不出问题的系统,问题故障不可怕,可怕的是没能有序的处理: 突发紧急事件太多,疲于应付,团队...

    文章 oneapm_official 2016-06-20 3268浏览量

  • 告警日志

    告警日志介绍   告警日志文件是一类特殊的跟踪文件(trace file)。告警日志文件命名一般为alert_<SID>.log,其中SID为ORACLE数据库实例名称。数据库告警日志是按时间顺序记录message和错误信息。   告警日志位置 在ORACLE 10g中,BACKGRO...

    文章 技术小美 2017-11-13 908浏览量

  • MySQL MTOP - 开源 MySQL 企业监控系统

    MySQLMTOP是一个由Python+PHP开发的MySQL企业级监控系统。系统由Python实现多进程数据采集和告警,PHP实现WEB展示和管理。最重要是MySQL服务器无需安装任何Agent,只需在监控WEB界面配置相关数据库信息 功能非常强大: 可对上百台MySQL数据库的状态、连接数、Q...

    文章 verdalee 2019-07-22 519浏览量

  • 基础设施助力双11(六):看网络如何“自愈”

    概述 每年的双十一对阿里的网络都是一次严峻的考验。在双十一当天,阿里的网络必须承载来自于世界各地数以亿计的用户所带来的巨大流量,任何故障的影响力都会被成倍放大。尽管大家做了很多努力尽量去避免故障的发生,但是故障仍然还是会发生,尤如阿里现今的大体量。这个时候,快速可靠的的故障恢复机制就尤为关键了。随...

    文章 初商 2019-07-31 713浏览量

  • 阿里云ECS基础安全加固

    一、主机安全(免费)    1.1 账号安全     实现步骤:      更改管理员账号的用户名,并且将GUEST账号的名更改成administrator,设置复杂密码并禁用。     机制:      避免被攻击者针对管理员账号进行暴力破解,攻击者既不知道账号也不知道密码,大大提升了破解难度。...

    文章 bbskkb 2019-10-25 1083浏览量

  • MySQL大事务导致的Insert慢的案例分析

    原文:MySQL大事务导致的Insert慢的案例分析 【问题】 有台MySQL服务器不定时的会出现并发线程的告警,从记录信息来看,有大量insert的慢查询,执行几十秒,等待flushing log,状态query end 【初步分析】 从等待资源来看,大部分时间消耗在了innodb_log_f...

    文章 杰克.陈 2018-10-21 1196浏览量

  • Zabbix alerter processes more than 75% busy

    一、故障现象: 昨天凌晨,手机收到几十条zabbix告警信息,告警内容如下: Zabbix alerter processes more than 75% busy 二、分析原因: 1、zabbix的后端数据库卡了(因为查看了下计划任务,晚上的确有个清理表空间的调度),有可能在MySQL锁表后有...

    文章 余二五 2017-11-06 1767浏览量

  • 基于Prometheus+Grafana的应用监控系统建设(一)

    Prometheus + Grafana 应用级监控方案(1)-概述 主流监控方案比较 比较项 Prometheus+Grafana Zabbix BKCE 整体方案 Prometheus更像一个“监控引擎”,文本配置,UI极简,适用于应用级监控,配合Grafana配置界面,UI够漂亮 ...

    文章 春天@钛鑫 2019-12-12 1200浏览量

  • 云上prometheus监控运维

    直达最佳实践:【云上prometheus监控运维】最佳实践频道:【点击查看更多上云最佳实践】这里有丰富的企业上云最佳实践,从典型场景入门,提供一系列项目实践方案,降低企业上云门槛的同时满足您的需求! 众能联合:我们公司目前正在使用阿里云的K8S的服务为我们的业务提供服务,在使用过程中遇到了些服务...

    文章 最佳实践小文 2020-02-13 1157浏览量

  • 阿里云-进程监控与告警

    1.背景 我在阿里云ECS上部署了个人网站,用到了mysql与tomcat,所以想要分钟级监控这两个进程是否alive。 2.安装监控agent 安装说明:https://help.aliyun.com/knowledge_detail/38859.html 进入阿里云控制台,产品与服务|监控与...

    文章 yichudu 2016-11-18 4664浏览量

  • 云服务器 ECS 监控:使用云监控监控ECS实例

    使用云监控监控ECS实例 本文以某门户网站的监控设置为例,讲解云监控服务如何给业务系统做实时护航。主要内容 监控的必要性 云监控配置 监控的必要性 越来越多的用户选择将业务部署在云上,大大减轻了运维成本和压力,其中合理的监控设置功不可没,设置合理的监控不仅可以让用户实时了解系统业务的运行情况...

    文章 琴瑟 2017-08-15 3998浏览量

  • 云上prometheus监控运维

    场景描述 PrometheusPrometheus是一款面向云原生应用程序的开源监控工具。本实践主要介绍基于阿里云容器服务Kubernetes集成部署Prometheus监控方案,通过grafana对监控数据进行可视化展示,通过Alertmanager配置统一的监控告警服务,轻松实现云原生监控运...

    文章 小然然 2020-02-21 491浏览量

  • crontab不执行perl脚本分析

    在新装的Linux服务器上部署了一个作业监控磁盘空间并提前告警,在shell脚本里面调用了一个perl脚本发送告警邮件。结果出现了一个很奇怪的现象:如 果手工执行该脚本/home/oracle/scripts/disk_capatiy_alarm.sh能发出告警邮件,但是在crontab里面发现 ...

    文章 潇湘隐者 2016-04-26 1931浏览量

  • Replication-Replication Distribution Subsystem: agent xxxxxx failed. Column names in each table must be unique

       最近遇到一个关于发布订阅(Replication)的奇葩问题,特此记录一下这个案例。我们一SQL SERVER数据库服务器出现大量告警。告警信息如下所示: DESCRIPTION: Replication-Replication Distribution Subsyst...

    文章 潇湘隐者 2016-04-27 1046浏览量

  • Windows 2003 Server C盘空间被IIS日志文件消耗殆尽案例

    今天突然收到手头一台数据库服务器的磁盘空间告警邮件,C盘空间只剩下5.41GB大小(当系统磁盘剩余空间小于总大小的10%时,发出告警邮件),如下图所示: 由于还有一些微弱印象:前阵子这台服务器的C盘剩余空间比较大。“事出反常必有妖”,肯定有什么不正常的情况发生,因为这台服务器有好几个账号,也是应...

    文章 潇湘隐者 2016-04-25 1206浏览量

  • 0. SQL Server监控清单

    原文:0. SQL Server监控清单 数据库服务器的监控可大致分为两类: (1) 状态监控:数据库服务器有没有在健康地运行? (2) 性能监控:健康运行的同时,有没有性能问题?可不可以更快些?   一. 服务器 1. 状态监控 (1) 服务器是否可访问? (2) 数据库服务是否启用? (3) ...

    文章 杰克.陈 2014-09-06 825浏览量

  • 打通钉钉+WebHook: 日志服务(SLS)告警实践

    阿里云日志服务是针对实时数据一站式服务,用户只需要将精力集中在分析上,过程中数据采集、对接各种存储计算、数据索引和查询等琐碎工作等都可以交给日志服务完成。 9月日志服务升级实时分析功能(LogSearch/Analytics),可以使用查询+SQL92语法对日志进行实时分析,并在结果分析可视化上,...

    文章 简志 2017-12-12 5538浏览量

  • 【功能发布】日志服务(SLS)11-12月功能合集

    新功能 1. 智能日志聚类(LogReduce) 摘要 新增智能文本模式聚类功能(LogReduce),能够在搜索分析过程中帮助发现日志的规律与特征,提升重要信息发现能力。 适用客户 开发者、运维、安全分析师 详细说明 用户在Logstore中开启文本模式聚类后,可以在查询中使用log_reduc...

    文章 简志 2019-01-09 4534浏览量

  • 如何通过阿里云基础安全组件确认云上资产安全状态

    前言 相信大家对于云监控已经是十分熟悉了,能够通过云监控快速确认云上资产的负载和使用情况。但是如何通过控制台快速确认云上资产的安全状态,可能对于大家而言相对会陌生一些。接下来给大家介绍下如何利用基础的云安全产品来确认云上资产的安全状态。 云安全基础安全组件架构 即使一个用户没有购买任何云安全产品,...

    文章 hetze 2019-07-05 1417浏览量

1 2 3 4 ... 32 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT