• 构建一个比较完善的监控系统

    包括进程的状态,端口的状况,存活的检查等,比如监控nginx,需要监控nginx的端口状态,进程是否存活,监控dns,需要监控端口,进程,还可以监控记录是否正常解析。这些可以简单地通过zabbix实现。4.应用层面性能...
    文章 2017-11-14 1420浏览量
  • Zabbix监控LVS状态及keepalived VIP漂移

    zabbix中创建一个lvs监控模板,创建五个名称如上的监控项,键值如下图所示: 3.1)lvs监控模板中item配置图 3.2)lvs监控模板中tragger配置图 此处对三个监控项进行报警设置 1)VIP有变动,无论从有到无或从无到有,...
    文章 2015-07-20 1051浏览量
  • IDC 监控技术介绍

    进程监控 查看进程树 pstree(Processes Tree) 格式:pstree[选项][PID或用户名] 选项: a:显示完整的命令行 p:列出对应PID编号 查看进程快照 ps-Processes Snapshot 格式:ps[选项]. 选项: aux:显示正在运行的...
    文章 2017-11-17 1305浏览量
  • Linux 系统监控概述

    这两种方式各有优势,大家可以在生产环境中根据实际需要进行选择使用,一般我们都是主要使用监控工具(Cacti与Nagios)进行监控并结合shell脚本进行辅助监控的方案。在下面的几篇博文中我们主要讲解snmp协议、...
    文章 2017-11-07 1350浏览量
  • ECS突遇流量跑满整么办

    阿里云上有一个服务叫做云监控CMS,做运维的有nagios,zabbix等知名的优秀开源程序,我介意用CMS,CMS本身也是基于这些开源程序进行过二次开发,功能十分强大 丰富 而且还十分简单回归正题,如果在云监控中查看宽带...
    文章 2017-12-22 1216浏览量
  • Zabbix 服务器性能指标参考(学习笔记十七)

    进程进程存在性1分钟采集,及时告警 进程不存在 网络流量所有业务流量总合1分钟采集,5分钟告警 注册注册响应时间2小时采集,5分钟告警>20s>30s 登录登录响应时间10分钟采集,5分钟告警>20s>30s 充值...
    文章 2018-04-04 1012浏览量
  • 轻松监控上万台服务器:企业运维监控平台架构设计与...

    Ganglia是一款为HPC(高性能计算)集群而设计的可扩展的分布式监控系统,它可以监视和显示集群中的节点的各种状态信息,它由运行在各个节点上的gmond守护进程来采集CPU、内存、硬盘利用率、I/O负载、网络流量情况等...
    文章 2017-11-21 1622浏览量
  • Zabbix使用手册-zabbix agent 类型所有key

    以下表格是zabbix agent所支持的所有key列表,添加一向监控的时候,首先想到的应该是zabbix agent是否已经有相关的key存在,而不是自己去写脚本来获取key。agent.hostname 返回被监控端名称(字符串) agent.ping 检测...
    文章 2017-11-15 1296浏览量
  • 降云十八掌——阿里云运维架构最佳实践(下)

    监控方案七:驻云监控2.0相比1.0,我们继承了云监控的站点监控等功能,弥补zabbix监控体系的不足。并且结合zabbix api,我们研发了阿尔法智能告警系统,直接砍掉了7*24值班人员的监控中心。所有告警通过智能电话,...
    文章 2019-08-29 3384浏览量
  • 运维工具箱

    Ant、Maven、Selenium、PyUnit、QUnit、JMeter、Gradle、PHPUnit监控类工具:Cacti、Nagios(Icinga)、Zabbix、基于时间监控前端Grafana、Mtop、MRTG(网络流量监控图形工具)、Monit、Diamond+Graphite+Grafana微服务...
    文章 2017-11-12 1801浏览量
  • 使用cgroup限制某个程序对内存的使用

    为了便于监控mongodb的慢查询等状态,在3台机器上都部署了packetbeat,通过抓取27017端口的流量发送到ES集群。但是第二天发现zabbix告警,显示某一台机器A(从节点)上的mongod进程宕了。日志显示是OOM导致的。再一...
    文章 2017-11-24 1289浏览量
  • 运维精简工具箱

    Cacti、Nagios(Icinga)、Zabbix、基于时间监控前端Grafana、 Mtop、MRTG(网络流量监控图形工具)、Monit、 Diamond+Graphite+Grafana 微服务平台: OpenShift、Cloud Foundry、Kubernetes、Mesosphere 性能监控工具: ...
    文章 2018-08-21 1308浏览量
  • 10 款免费的网络监控工具

    Monit 是一个Linux/UNIX系统上开源的进程、文件、目录和文件系统监控和管理工具,可自动维护和修复一些错误的情况。2.Ganglia Ganglia是一个跨平台可扩展的,高 性能计算系统下的分布式监控系统,如集群和网格。它是...
    文章 2011-11-26 837浏览量
  • 10 款免费的网络监控工具

    Monit 是一个Linux/UNIX系统上开源的进程、文件、目录和文件系统监控和管理工具,可自动维护和修复一些错误的情况。2.Ganglia Ganglia是一个跨平台可扩展的,高 性能计算系统下的分布式监控系统,如集群和网格。它是...
    文章 2011-11-26 1127浏览量
  • 阿里云ECS服务器CPU总是100%跑满该怎么排查?

    虽然zabbix监控上说没有,但是我们要检查一下看看有没有异常的进程名字。4)查看全部容器的资源使用docker stats$(docker ps-a-q),看看能不能从容器上排查。5)有了“too many open files”的启发,计算打开文件...
    文章 2020-09-28 1160浏览量
  • 2020最新 阿里云ECS的CPU100%排查

    虽然zabbix监控上说没有,但是我们要检查一下看看有没有异常的进程名字。4)查看全部容器的资源使用docker stats$(docker ps-a-q),看看能不能从容器上排查。5)有了“too many open files”的启发,计算打开文件...
    文章 2020-07-05 267浏览量
  • Docker监控怎么做?

    这个目前监控工具比较常用的方式,比如zabbix,在主机上运行一个进程进行相关数据的采集。CLI方式 命令行的方式是最基本的方式,比如在linux系统上使用top,vmstat,netstat写一些shell脚本进行数据的采集,再把数据...
    文章 2017-05-02 2005浏览量
  • 运维工程师笔试题(一)

    Zabbix 监控数据与报警是分开的,zabbix界面更完美 2 后期批量修改监控服务 Nagios 用脚本来修改所有主机的server文件,加入新增服务 Zabbix 只需要手动模板添加监控项 3:两者都支持短信邮箱报警等 10:当用户在...
    文章 2017-11-08 2490浏览量
  • 工具网站集锦

    Ant、Maven、Selenium、PyUnit、QUnit、JMeter、Gradle、PHPUnit监控类工具:Cacti、Nagios(Icinga)、Zabbix、基于时间监控前端Grafana、Mtop、MRTG(网络流量监控图形工具)、Monit、Diamond+Graphite+Grafana微服务...
    文章 2017-11-22 1609浏览量
  • The summary of Interview

    而更深层次的是扮演者管理、制度和推行、监督角色,处理智能化、批量部署、网站架构优化、监控预警、流量及日志分析统计、权限管理、安全优化等事物;应该具有一定的严谨性和责任心。公司所用防火墙设备 深信服 考虑...
    文章 2017-04-16 908浏览量
  • KVM虚拟机磁盘readonly故障分析

    此次定位问题耗时一周:1、监控不到位,由于zabbix 进行大批量机器对比时,效率很低,临时部署了openfalcon和grafana,耗时较长。2、没有关注到备份任务,之前一致以为是vm用户的问题,但是通过监控定位并不是用户的...
    文章 2017-11-30 1385浏览量
  • 《Ossim应用指南》入门篇

    常规监控软件都是使用SNNM实现流量监控监控对象是什么?你要监控谁就得在它上面启用SNMP代理进程,也就是在被管理设备上启用代理,在OSSIM还有那些代理呢?比如Snare,Ossec Agent,OCS Agent等等。随着深入OSSIM...
    文章 2016-05-25 4049浏览量
  • 车联网上云最佳实践(二)

    我们公司的运维管控软件绝大部分是以开源为主的运维软件,种类繁多,例如开源跳板机Jumpserver,zabbix监控系统,持续集成Jenkins,自动化运维Ansible等等,这些软件都需要配置独立的登录账号。导致账号繁多,管理...
    文章 2018-08-22 2538浏览量
  • 服务器故障排查的前五分钟[转]

    (比如Munin、Zabbix、Nagios、New Relic…什么都可以) 是否有日志可以查看?(比如Loggly、Airbrake、Graylog…) 最后两个是最方便的信息来源,不过别抱太大希望,基本上它们都不会有。只能再继续摸索了。二、有谁...
    文章 2016-04-07 2017浏览量
  • zabbix监控默认的item key列表

    zabbix客户端(agent)的版本。返回字符串 kernel.maxfiles 操作系统最大的文件打开数量。返回整数 kernel.maxproc 操作系统最大的进程数。返回整数 net.dns[<ip>name,<type>lt;timeout>lt;count>...
    文章 2017-11-12 1937浏览量
  • 车联网上云最佳实践(一)

    痛点3:运维工具零散、运维工作复杂繁琐我们公司的运维管控软件绝大部分是以开源为主的运维软件,种类繁多,例如开源跳板机Jumpserver,zabbix监控系统,持续集成Jenkins,自动化运维Ansible等等,这些软件都需要...
    文章 2018-08-31 2896浏览量
  • Linux 服务器故障排除的前五分钟(First 5 Minutes ...

    (比如Munin、Zabbix、Nagios、New Relic…什么都可以) 是否有日志可以查看?(比如Loggly、Airbrake、Graylog…) 最后两个是最方便的信息来源,不过别抱太大希望,基本上它们都不会有,只能再继续摸索了。下面...
    文章 2017-11-07 1109浏览量
  • 史上最全SQL优化方案

    1)Zabbix监控主机、系统、数据库(部署zabbix监控平台) 2)pt-query-digest:分析慢日志 3)MySQL slap:分析慢日志 4)sysbench:压力测试工具 5)MySQL profiling:统计数据库整体状态工具 6)Performance ...
    文章 2019-11-29 2390浏览量
  • saltstack案例 自助机

    为了确保 KioskScheduler 运行正常,应用层面通过 monit 实现进程监控,业务层面的规则执行与否以及是否达到预计,我们通过 python-nmap 实现了一个批量扫描的脚本,每次开关机时间点触发后的 5min/10min/15min ...
    文章 2017-11-27 978浏览量
  • 饿了么技术往事(下)

    一个几乎酿成事故的事件,让我们下定决心优化架构:当时由于一个配置错误,导致本来应该命中CDN缓存的用户端请求全部回源,瞬间F5承接了巨大的流量冲击(正常流量,非恶意攻击),那天看着监控曲线,在午高峰单量...
    文章 2020-11-26 2656浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化