• Zabbix小记

    zabbix server-zabbix软件的核心进程,执行监控操作,与zabbix proxies和agents进行交互、触发器计算、发送告警通知,也是数据的中央存储库。zabbix agent-部署在监控对象上的进程,能够主动监控本地资源和应用。...
    文章 2021-09-10 39浏览量
  • zabbix feature&architecture&Data flow

    集中配置,统计,告警,存储AGETN传来的数据. 2.数据库,用于存储zabbix的数据. 3.WEB接口,管理界面,注意如果使用SQLite作为数据库的话,WEB接口必须和数据库在同一台服务器,可能因为SQLite没有网络连接接口. 4.代理,可选...
    文章 2016-03-25 2935浏览量
  • 云服务器 ECS 监控:监控ECS实例

    zabbix入门容易、上手简单、功能强大并且开源免费,它易于管理和配置,能生成比较漂亮的数据图,其自动发现功能大大减轻日常管理的工作量,丰富的数据采集方式和API接口可以让用户灵活进行数据采集,而分布式系统...
    文章 2017-08-14 4743浏览量
  • 运维架构服务监控Open-Falcon

    比如以zabbix为例,上报的数据为hostname(或者ip)、metric,那么用户添加告警策略、管理告警策略的时候,就只能以这两个维度进行。举一个最常见的场景:hostA的磁盘空间,小于5%,就告警。一般的服务器上,都会有...
    文章 2017-10-13 2555浏览量
  • zabbix安装

    API接口:支持研发扩展;zabbix database负责专用于存储所有配置信息以及由Zabbix收集的数据;zabbix server是负责接收agnet发送的报告信息的核心组件,所有配置、统计数据及操作数据均由其组织进行;zabbix server...
    文章 2017-11-26 1319浏览量
  • zabbix 实战部署

    ①具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库、FTP 等通用协议监控、多种告警方式、详细的报表图表绘制)。②支持自动发现网络设备和服务器(可以通过配置自动发现服务器规则来...
    文章 1970-01-01 3510浏览量
  • 基于阿里云云监控的企业级监控平台构建

    随着阿里云云监控产品的日渐完善,基于云计算的IT资产监控越来越方便,结合已经开放的API和外部回调接口等功能,企业级客户的监控系统可以变得更加强大。传统需要在主机上装agent的监控体系,例如zabbix以及类似其他...
    文章 2019-07-17 1074浏览量
  • 让AIOps把你从繁复耗时的基础运维中解放出来

    传统的固定告警基线有很多缺陷,例如反复触发、恢复会产生大量告警,并且反复触发的告警也会掩盖真实情况。动态告警基线是根据历史数据统计值生成的,除自动生成外,也可人为创建、修改。对于AI来说应用于整个运维会...
    文章 2018-06-27 2820浏览量
  • 智能运维(AIOps)中几处问题的解决方案与思路

    监控Agent或者脚本也会将部分状态数据汇报到类似于Zabbix这样的监控软件中,集中进行监控和告警。当服务器规模越来越大时,如何统一、自动化处理这些“事件”的需求就越来越强烈,毕竟登录服务器查看日志这种方式...
    文章 2018-08-16 3035浏览量
  • 从零开始入门 K8s|可观测性:监控与日志

    etheus 提供了一个外置组件叫 Alentmanager,它可以将相应的报警信息通过邮件或者短信的方式进行数据的一个告警。在数据消费上面,可以通过上层的 API clients,可以通过 web UI,可以通过 Grafana 进行数据的展现和...
    文章 2019-10-15 2949浏览量
  • 基于Kubernetes的容器云在万达的落地

    虽然 Grafana 目前支持邮件进行一些简单的告警,但我们还是通过制定一些监控点、告警机制、告警等级等,然后接入公司内部现有 Zabbix 平台来进行告警。邮件告警示例如下: 5、日志方案: 容器平台的日志系统一般包括...
    文章 2018-12-14 1669浏览量
  • 饿了么技术往事(下)

    出于容灾的需要,数据在一个数据中心写入后,需要同步到其他数据中心2、循环复制阻断:确保一条数据的复制是单向的3、数据变更事件广播:供业务方订阅用于更新缓存、异步解耦等等场景4、写冲突的记录和告警:确保第...
    文章 2020-11-26 3396浏览量
  • Pull or Push?监控系统如何选型

    数据获取方式:接口型(只能通过某些API拿去);DSL(可以有一些计算,例如PromQL、GraphQL);SQL(标准SQL、类SQL);商业属性:开源免费(例如Prometheus、InfluxDB单机版);开源商业型(例如InfluxDB集群版、...
    文章 2021-08-27 2038浏览量
  • 《ELK Stack权威指南(第2版)》一导读

    而5.x系列同样携带了大量崭新的特性,在日志分析、监控告警等场景,带来性能提升、管理简化、功能丰富等诸多好处。推荐广大读者积极尝试和升级。IT运维模式正在向数据驱动、精细化、智能化发展。这个过程中,ELK ...
    文章 2017-05-02 2767浏览量
  • 饿了么交易系统 5 年演化史

    据不严格考究,从 Git 的提交历史看,订单部分的第一个 commit 是余立鑫同学于 2012 年 9 月 1 日提交的,内容是"add eos service for zeus.currently only defind a simple get api.",这个 EOS 指的就是订单系统,...
    文章 2020-04-17 1153浏览量
  • 大众点评开源分布式监控平台 CAT 深度剖析

    目前在中间件(MVC、RPC、数据库、缓存等)框架中得到广泛应用,为美团点评各业务线提供系统的性能指标、健康状况、监控告警等。本文会对CAT整体设计、客户端、服务端等的一些设计思路做详细深入的介绍。二、背景...
    文章 2016-11-15 2214浏览量
  • Pull or Push?监控系统如何选型

    因此在配置告警的时候还需要结合数据齐全度数据进行综合考虑。数据齐全度的计算也一样是依赖于服务发现模块&xff0c;Pull方式是按照一轮一轮的方式进行拉取&xff0c;所以一轮拉取完毕后数据就是齐全的&xff0c;即使部分...
    文章 2021-08-09 243浏览量
  • 车联网上云最佳实践(五)

    3、监控报警传统IDC架构中我们的监控系统是自建的zabbix监控系统,随着公司业务快速发展,监控项也急剧增加,由最初的1000个监控项增加到3w个监控项,监控系统数据库性能跟不上,查询很慢,告警延迟和误报的现象逐渐...
    文章 2018-08-31 3200浏览量
  • 车联网上云最佳实践(二)

    它具有与平台无关的RESTful API接口,能够提供99.999999999%(11个9)的数据可靠性和99.99%的服务可用性。可以使用阿里云提供的API/SDK接口或者OSS迁移工具轻松地将海量数据移入或移出阿里云OSS。数据存储到阿里云...
    文章 2018-08-31 3408浏览量
  • 车联网上云最佳实践(三)

    它具有与平台无关的RESTful API接口,能够提供99.999999999%(11个9)的数据可靠性和99.99%的服务可用性。可以使用阿里云提供的API/SDK接口或者OSS迁移工具轻松地将海量数据移入或移出阿里云OSS。数据存储到阿里云...
    文章 2018-08-23 3353浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化