• Zabbix+Cloud Alert 实践分享

    前言 如果要问老牌开源监控工具泰斗,当zabbix莫属。...希望能有帮助到大家,快速将Zabbix 的告警接入到 Cloud Alert,借用Cloud Alert平台,快速实现告警的降噪、分派和通知(电话、短信、微信、邮件、APP)。
    文章 2019-09-11 1108浏览量
  • Zabbix+Cloud Alert 实践分享

    希望能有帮助到大家,快速将Zabbix 的告警接入到 Cloud Alert,借用Cloud Alert平台,快速实现告警的降噪、分派和通知(电话、短信、微信、邮件、APP)。“阿里巴巴开源镜像站 提供全面,高效和稳定的系统镜像、应用...
    文章 2020-02-17 343浏览量
  • 使用SLS发现服务节点异常

    参考什么是日志服务【链接】日志服务数据采集概述【链接】查询和分析日志【链接】什么是日志服务告警【链接】SLS告警-学习路径【链接】SLS告警-行动策略【链接】通知内容定制【链接】进一步参考SLS&xff08;...
    文章 2021-08-06 59浏览量
  • 腾讯滨海大厦 智能楼宇 智慧建筑 3D可视化管理系统-优...

    以高亮、动画的形式展示楼宇内业务管线流向及工作原理;以悬浮信息牌的形式展示楼宇内智能实时监测、告警信息;以图表、数据对比形式展示楼宇内综合能耗统计;对需控制或应急处理的智能设备可进行远程开关操作。视频...
    文章 2018-12-08 5518浏览量
  • 提高效率,让你轻松玩转开发运维|阿里云产品精选内容...

    每日精选内容一分钟完成ECS机器数据的智能巡检告警对于运维的日常工作来说,服务器监控是必须且最基础的一项内容。在企业基础设施运维过程中,管理员必须能够掌握所有服务器的运行状况,以便及时发现问题,尽可能...
    文章 2021-07-26 56浏览量
  • 信息安全-安全审计-阿里云安全审计产品

    安全审计是指对信息系统中安全相关的活动信息进行获取、存储、分析和告警工作。常规的安全审计,通常只对对应的安全信息进行记录,并根据预定义的策略进行告警。其作用类似于现实社会中的安防摄像头,对公共区域的...
    文章 2021-01-27 141浏览量
  • 如何判断头上顶着一片草原?这里有一些小技术

    然而 SIEM 也存在局限,监控人员往往被淹没在海量的告警之中无从下手,原因之一就是对于威胁的告警没有处理的依据,例如缺乏经验的监控人员很难判定:某一条安全事件告警是扫描还是针对性攻击引起的(通常后者需要更...
    文章 2017-08-09 1302浏览量
  • 如何在阿里云从零搭建一个防入侵体系

    提供了紧急事件,攻击事件,漏洞事件,情报事件共4个大类型的告警,每个大类型又包含各种小类安全事件的告警配置 点击选择不同的告警事件,进行邮件和短信告警 4、进入“攻击”导航内,对攻击事件进行告警处理,以及...
    文章 2017-03-29 4838浏览量
  • 基于 RocketMQ Prometheus Exporter 打造定制化 ...

    这里重点介绍一下消费者堆积告警指标,在以往的监控系统中,由于没有像 Prometheus 那样有强大的 PromQL 语言,在处理消费者告警问题时势必需要为每个消费者设置告警,那这样就需要 RocketMQ 系统的维护人员为每个...
    文章 2021-04-07 2019浏览量
  • 【阿里云MVP Meetup 第五期】如何使用Elasticsearch...

    阿里云 MVP侯选人 上海安畅运维专家 韩军辉分享《ELK在运维工作中应用两三事》—— 基于ELK Stack、sflow技术、sflowtool工具、kafka消息队列等开源技术构建一套流量分析、DDOS告警系统。从流量收集、分析、存储、...
    文章 2018-01-23 2200浏览量
  • 浅谈神经网络训练方法,Deepmind更青睐正向传播

    实时告警的精髓在于在告警信息没有发出时,预测到相关集群跑的应用的异常,即指标异常。下图反映的是集中监控平台基线告警的实例。时间粒度为每10分钟预测异常,其中红色为A指标实际值,蓝色为B指标实际值。蓝色区间...
    文章 2017-08-01 1322浏览量
  • 基于 RocketMQ Prometheus Exporter 打造定制化 ...

    0借助 PromQL 这一条语句不仅可以实现为任意一个消费者创建消费告警堆积告警&xff0c;而且还可以使消费堆积的阈值取一个跟生产者发送速度相关的阈值。这样大大增加了消费堆积告警的准确性。RocketMQ-Exporter 使用示例...
    文章 2021-04-12 140浏览量
  • 阿里云容器Kubernetes监控(一)-资源监控

    而容器后指的是如何对部署到容器环境后的监控、运维、告警与调优。今天我们主要来探讨的是如何在容器的环境中进行资源维度的监控。先谈容器与监控 关于容器的监控方案有非常多的种类,大家耳熟能详的一些组件包括:...
    文章 2018-04-02 5989浏览量
  • 模拟驾驶能力输出,赋能客户提升稳定性信心

    监控告警工具-TAM Alarm CenterTAM Alarm Center(简称TAC)是SRE团队为混合云精心打造的一站式告警运维平台,覆盖混合云所涉及的云产品、大数据、云实例以及用户所涉及的站点应用等告警,提供告警生命周期管理以及...
    文章 2020-10-28 12217浏览量
  • 技术原理与生态

    告警的角度,它也可以写一些告警的规则,通过 webhook 等对外告警。这是做指标系统比较常用的一套堆栈。第三是日志。如何从日志获得可观测性?日志很多就是一串字符串,所以要从这里面获得可观测性,很重要的一步...
    文章 2020-12-17 560浏览量
  • 大众点评账号业务高可用进阶之路

    我们曾经踩过一次坑,因为告警太多就把告警关了,结果就在关告警的这段时间业务出问题了,我们没有及时发现。为了提高每条告警的定位速度,我们在每条告警后面加上维度分析。如下图(非真实数据),告警里直接给出...
    文章 2018-06-14 1433浏览量
  • Zabbix 的安装和使用|学习笔记

    告警管理:支持多条件告警&xff0c;支持多种告警方式&xff0c;支持多组模板&xff0c;模板继承。l 告警设置:告警周期&xff0c;告警级别&xff0c;告警恢复通知、告警暂停&xff0c;时段阈值、支持维护周期、支持单机停用&xff1b;图形...
    文章 2021-09-13 26浏览量
  • Hadoop-任务调度系统比较

    邮件告警失败和成功 SLA告警 重启失败的Jobs Azkaban的设计之初主要是基于可用性的考虑。在LinkedIn运行的有些年头了,一直驱动着它们的Hadoop和数据仓库。它由3个关键部分组成,分别是: 关系行数据库(MySQL):...
    文章 2016-04-25 3124浏览量
  • Hadoop-任务调度系统比较

    邮件告警失败和成功 SLA告警 重启失败的Jobs Azkaban的设计之初主要是基于可用性的考虑。在LinkedIn运行的有些年头了,一直驱动着它们的Hadoop和数据仓库。它由3个关键部分组成,分别是: 关系行数据库(MySQL):...
    文章 2016-04-25 2578浏览量
  • Serverless 时代 DevOps 的最佳打开方式

    3)监控告警:丰富的告警源上报、告警收敛处理、多种告警渠道触达(如邮箱、短信、电话等)。Logging代表离散的数据,提供以下功能:1)实时日志:Stdout、Stderr 实时查看;2)文件日志:自定义采集规则、持久化...
    文章 2021-03-18 969浏览量
  • Hadoop-任务调度系统比较

    邮件告警失败和成功 SLA告警 重启失败的Jobs Azkaban的设计之初主要是基于可用性的考虑。在LinkedIn运行的有些年头了,一直驱动着它们的Hadoop和数据仓库。它由3个关键部分组成,分别是: 关系行数据库(MySQL):...
    文章 2017-11-16 1100浏览量
  • 网络主机监控-nagios应用漫谈(一)

    Nagios是一款用于系统和网络监控的应用程序,它可以在你设定的条件下对主机和服务进行监控,在状态变差和变好的时候给出告警信息。Nagios通常由一个主程序(Nagios)、一个插件程序(Nagios-plugins)和四个可选的ADDON...
    文章 2017-11-08 1045浏览量
  • 好玩又实用,阿里巴巴开源混沌工程工具 ChaosBlade

    验证监控告警的时效性通过对系统注入故障,验证监控指标是否准确,监控维度是否完善,告警阈值是否合理,告警是否快速,告警接收人是否正确,通知渠道是否可用等,提升监控告警的准确和时效性。定位与解决问题的应急...
    文章 2019-03-28 12881浏览量
  • 深入浅出开源监控系统Prometheus(上)

    Prometheus生态系统包括了提供告警引擎、告警管理的AlertManager,支持push模式数据上报的PushGateWay,提供更优雅美观的可视化界面的Grafana,支持远端存储的RemoteStoreAdapter;log转换为metric的Mtail等等。除此...
    文章 2020-05-11 1136浏览量
  • 爱奇艺在 Dubbo 生态下的微服务架构实践

    告警方面,我们将告警策略设置在 Prometheus 中,具体的告警会由 alert-manager 通过 adapter 发送给内部的监控告警平台。监控 dashboard 查看、告警策略设置、订阅的入口统一设置在我们内部的全链路监控平台上,...
    文章 2020-09-03 1316浏览量
  • 再次升级-Kubernetes Ingress监控进入智能时代

    但构建一套完整的访问日志分析系统还是非常困难,这其中包括了很多过程和工作:采集、存储、分析、可视化、告警等。在实施过程中最为复杂的点在于: 采集问题:如何保证日志采集的可靠性、性能消耗、延时问题;分析...
    文章 2020-10-19 6498浏览量
  • 车主无忧:为什么放弃开源Kafka?

    在存储开销方面:开源 Kafka 多副本存储,存储压力大,且会在磁盘写满的情况下直接停止运行,没有保扩机制,需要额外提供告警人工处理。在性能方面:在处理冷数据读的时候处理速度明显下降,数据写入有一定失败几率...
    文章 2020-11-06 5614浏览量
  • 基于Knative开发应用

    过一分钟左右可以看到邮件告警通知 Autoscaler 简单压测可以到这里下载二进制文件,然后执行如下所示的命令开始压测。hey-z 15s-c 30"http://wordpress.default.kubedemo.com/" &kubectl get pods knload 压...
    文章 2019-06-14 12569浏览量
  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的...

    而庖丁可以同时进行网络拓扑发现、告警信息自动聚合分析、日志信息自动获取、命令工具自动下发这四项工作,把整个复杂问题的定位时长从1-2个小时缩减为3分钟,给各类场景带来极大的诊断效率提升。针对已经确定的两个...
    文章 2018-01-05 4827浏览量
  • 基础设施助力双11(十):百万级物理和虚拟网络设备的...

    而庖丁可以同时进行网络拓扑发现、告警信息自动聚合分析、日志信息自动获取、命令工具自动下发这四项工作,把整个复杂问题的定位时长从1-2个小时缩减为3分钟,给各类场景带来极大的诊断效率提升。针对已经确定的两个...
    文章 2019-07-31 903浏览量
1 2 3 4 ... 8 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化