开发者社区> 云原生> 云原生可观测

云原生可观测

关注

云原生可观测基于Prometheus、Grafana 、OpenTelemetry 等核心产品, 形成指标、链路存储分析、异构数据源集成的数据层, 通过标准PromQL和SQL提供大盘展示、告警与探索能力。

0
今日
2134
内容
4
活动
239
关注
|
2月前
|
云安全 安全 Cloud Native
|

一文了解什么是CNAPP

在云计算蓬勃发展的今天,企业面临的安全挑战愈发复杂。传统安全方案已力不逮,CNAPP(云原生应用保护平台)应运而生,革新云安全领域。CNAPP专为云环境设计,提供全生命周期安全保护,具备微隔离、访问控制、数据保护等功能,并利用自动化与AI技术简化管理、智能响应威胁,适用于多云、DevOps等多种场景。尽管存在技术复杂性和成本等挑战,CNAPP仍将持续进化,变得更加智能、自动且易于集成,助力企业构建稳健的云安全体系。

216 0
|
11月前
|
数据采集 监控 供应链
|

MES系统软件体系架构及应用

MES系统是数字化车间的核心。MES通过数字化生产过程控制,借助自动化和智能化技术手段,实现车间制造控制智能化、生产过程透明化、制造装备数控化和生产信息集成化。生产管理MES系统主要包括车间管理系统、质量管理系统、资源管理系统及数据采集和分析系统等,由技术平台层、网络层以及设备层实现。

1078 1
|
数据采集 监控 开发者
|

千万级可观测数据采集器--iLogtail代码完整开源

2022年6月29日,阿里云iLogtail开源后迎来首次重大更新,正式发布完整功能的iLogtail社区版。本次更新开源全部C++核心代码,该版本在内核能力上首次对齐企业版,开发者可以构建出与企业版性能相当的iLogtail云原生可观测性数据采集器。本次发布新增日志文件采集、容器文件采集、无锁化事件处理、多租户隔离、基于Pipeline的新版配置方式等诸多重要特性,全面增强社区版的易用性和性能,欢迎广大开发者关注、共建。

1413 0
|
运维 Prometheus 监控
|

《阿里云可观测最佳实践》——阿里云可观测产品介绍

《阿里云可观测最佳实践》——阿里云可观测产品介绍

371 0
|
SQL 编解码 Prometheus
|

全面焕新|详解 Grafana v9.0.x 新增功能特性

Grafana 9.0 是一个提升 Grafana 易用性的版本,通过全新的和改进的操作界面来获取数据,以及默认的 Grafana 警报体验。

2175 0
|
5月前
|
tengine Java 测试技术
|

PTS压测问题之调试返回403如何解决

PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。

154 2
|
存储 运维 监控
|

深入浅出 eBPF|你要了解的 7 个核心问题

eBPF 提供的只是一个框架和机制,核心还是需要用 eBPF 的人对软件栈的理解,找到合适的插桩点,能够和应用问题进行关联。

635 0
|
缓存 运维 监控
|

蚂蚁金服智能监控云原生可观测大盘设计概览

本文将介绍蚂蚁金服监控产品在监控大盘方面的创新设计与尝试。

1480 0
|
传感器 人工智能 监控
|

Gartner发布《2023年十大战略技术趋势》,应用可观测性入选!

Gartner发布《2023年十大战略技术趋势》,应用可观测性入选!

890 1
|
消息中间件 弹性计算 Prometheus
|

问题盘点|使用 Prometheus 监控 Kafka,我们该关注哪些指标

Kafka 作为当前广泛使用的中间件产品,承担了重要/核心业务数据流转,其稳定运行关乎整个业务系统可用性。本文旨在分享阿里云 Prometheus 在阿里云 Kafka 和自建 Kafka 的监控实践。

1873 30
|
SQL 机器学习/深度学习 运维
|

这才是可观测告警运维平台——20个SLS告警运维场景

本文以20个SLS告警运维场景说明可观测告警运维平台的痛点需求。

1767 0
|
4月前
|
运维 监控 网络协议
|

SRE 排障利器,接口请求超时试试 httpstat

推荐一款用于服务调用排查的工具——httpstat,类似curl,能详细显示HTTP请求各阶段耗时,包括DNS解析、TCP连接等。

71 1
|
5月前
|
缓存 负载均衡 测试技术
|

pts压测问题之接口超时如何解决

PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。

365 1
|
5月前
|
存储 Prometheus 监控
|

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测(重点为指标监控体系)为切入点,对比 OpenTelemetry 与 Prometheus 的相同与差异,后重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理,最后介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry 及相关落地实践案例,希望能更好的帮助读者更好的理解 OpenTelemetry 及与 Prometheus 的生态融合。

457 0
|
Prometheus 监控 Go
|

Golang 微服务监控浅谈

监控作为度量可视化工具在服务治理中一直是承担比较重要的角色。一个良好的架构设计,监控一定是完善且使用便捷的。这篇文章我将会介绍Go微服务的度量与监控方案,参照我的使用经验,在Consul、Kubernetes不同部署环境下的使用。

489 0
|
XML JavaScript Java
|

可观测性之Log4j2优雅日志打印

可观测性之Log4j2优雅日志打印

434 0
|
存储 运维 监控
|

跟误告警说再见,Smart Metrics 帮你用算法配告警

本文从两类常见的无效告警规则入手,分析有效告警配置难,误告警泛滥的原因,介绍 Smart Metrics 是如何帮助用户解决告警难配的问题的,并介绍一些最佳实践。

794 0
EMQ
|
JSON 运维 Prometheus
|

易操作、可观测、可扩展,EMQX如何简化物联网应用开发

本文将从可操作性、可观测性、扩展性三个方面分享大规模分布式物联网MQTT消息服务器EMQX 5.0在运维监测、问题排查以及功能扩展中的功能优化,探索如何利用这些优化助力物联网应用开发。

412 0
|
监控 Kubernetes 安全
|

关于 eBPF 安全可观测性,你需要知道的那些事儿

聊一聊eBPF 安全可观测性。

1455 0
|
存储 弹性计算 运维
|

阿里云技术专家杨泽强:弹性计算云上可观测能力构建

可观测性的发展趋势为标准化与多样化

744 0
|
存储 Prometheus 监控
|

Istio on ACK集成生态(1): 集成TSDB助力可观测性存储

使用Prometheus进行监控是Istio提供的监控能力之一,通过集成TSDB有效地解决持久化存储的问题。

2567 0
|
5月前
|
编解码 前端开发 JavaScript
|

Grafana Plugin: 支持 jsx 实时渲染的 grafana 面板插件

A JSX real-time rendering grafana panel plugin. / 一个支持 JSX 实时渲染的 grafana 面板插件

224 3
|
5月前
|
测试技术
|

PTS压测问题之下载接口额外收费如何解决

PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。

163 2
|
机器学习/深度学习 存储 人工智能
|

首次引入!用因果推理做部分可观测强化学习|AAAI 2023

首次引入!用因果推理做部分可观测强化学习|AAAI 2023

188 0
|
SQL 运维 资源调度
|

开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化

在本篇文章中,我们将介绍大数据集群领域所需的可观测性,实践大数据集群可观测所需要的条件和面临的挑战,以及阿里云EMR 产品如何通过 EMR Doctor 实现大数据可观测并向用户提供相关能力。

17268 4
|
编解码 运维 监控
|

业务&用户体验可观测场景解读|学习笔记(二)

快速学习业务&用户体验可观测场景解读

295 0
|
存储 运维 监控
|

让云原生可观测化繁为简,Alibaba Cloud Lens正式发布

9月28日,阿里云正式发布了云产品可观测平台Alibaba Cloud Lens(Lens, 透镜的意思,取名为Lens意味着洞察云产品细微的变化),可以从成本、性能、安全、数据保护、稳定性、访问分析六个纬度,提供对存储类、网络类、数据库类等云产品的精细化运维管理能力。

626 0
|
SQL 运维 Java
|

ARMS Java 应用诊断-全景图首次发布!

随着更多企业迁移上云,应用运行环境、网络发生变化。当应用遇到故障需要问题定位时,一些传统问题定位手段由于效率、准确性等问题已无法满足 SRE 运维需求。本文以问题驱动为视角,结合阿里巴巴自身实践与客户服务经验,完整梳理可观测时代 Java 应用诊断知识图谱。

2022 0
|
Cloud Native C语言
|

基于eBPF的云原生可观测性开源项目Kindling之慢系统调用

Kindling通过eBPF技术和内核提供的系统调用tracepoint捕获了所有的系统调用数据,然后把系统调用与线程信息做了关联,并在用户空间对系统调用的enter和exit进行了latency的计算以判断是否为慢系统调用。

407 0
|
Prometheus 监控 Cloud Native
|

.Net微服务实战之可观测性(二)

.Net微服务实战之可观测性(二)

192 0
|
存储 SQL 运维
|

OPLG:新一代云原生可观测最佳实践

> 作者:夏明(涯海) > 创作日期:2022-04-15 > 专栏地址:[【稳定大于一切】](https://github.com/StabilityMan/StabilityGuide) ## OPLG 是什么 随着云原生架构的兴起,可观测的边界与分工被重新定义,传统的容器/应用/业务分层监控边界被打破,Dev、Ops、Sec 的分工逐渐模糊。大家意识到 IT 系统作为一个有

418 0
|
数据采集 弹性计算 运维
|

阿里巴巴高级技术专家姜文锋:云服务器可观测能力的探索与实践

本篇内容分享了云服务器可观测能力的探索与实践。

609 0
|
数据采集 运维 监控
|

阿里千万实例可观测采集器-iLogtail正式开源

11月23日,阿里正式开源可观测数据采集器iLogtail。作为阿里内部可观测数据采集的基础设施,iLogtail承载了阿里巴巴集团、蚂蚁的日志、监控、Trace、事件等多种可观测数据的采集工作。iLogtail运行在服务器、容器、K8s、嵌入式等多种环境,支持采集数百种可观测数据,目前已经有千万级的安装量,每天采集数十PB的可观测数据,广泛应用于线上监控、问题分析/定位、运营分析、安全分析等多种场景。

1494 0
|
存储 Prometheus 监控
|

打造Java可观测性的5个关键步骤

伴随云原生和微服务的普及,可观测性设计基本上是作为一个线上业务服务必备的基础能力。这篇文章我将介绍天罡项目围绕可观测性的三大支柱:日志,指标以及链路追踪所做的可观测性设计和实践,以及项目中实施可观测性的5个关键步骤。

819 0
|
4月前
|
Prometheus 监控 Cloud Native
|

grafana展示的CPU利用率与实际不符的问题探究

观察到`mpstat`命令显示单核CPU的`%usr`和`%sys`分别持续在70%和20%,而Grafana监控数据显示较低。问题源于Grafana表达式计算的是CPU时间增量而非利用率。`mpstat`通过`/proc/stat`获取数据并计算CPU利用率,而`node-exporter`直接导出原始数据。调整Grafana表达式以匹配`mpstat`的计算方式后,两者结果一致。解决方案是修正Grafana查询以准确反映CPU占用率。

167 1
|
5月前
|
测试技术
|

PTS插件问题之录制插件消失如何解决

PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。

106 1
|
5月前
|
Java 测试技术 API
|

PTS取值问题之取值失败如何解决

PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。

72 0
|
5月前
|
SQL 监控 测试技术
|

PTS压测问题之token值不一样配置如何解决

PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。

325 1
|
SQL 人工智能 机器人
|

《阿里云可观测最佳实践》——1.深绘智能(上)

《阿里云可观测最佳实践》——1.深绘智能(上)

244 0
|
SQL 弹性计算 监控
|

《阿里云可观测最佳实践》——2.叫叫阅读(上)

《阿里云可观测最佳实践》——2.叫叫阅读(上)

244 0
|
运维 监控
|

《阿里云可观测最佳实践》——2.叫叫阅读(下)

《阿里云可观测最佳实践》——2.叫叫阅读(下)

154 0
|
监控 前端开发 测试技术
|

《阿里云可观测最佳实践》——道旅

《阿里云可观测最佳实践》——道旅

102 0
|
运维 监控 数据可视化
|

可观测性和传统监控的三大区别

可观测性和传统监控的三大区别

553 0
|
JavaScript
|

可观测性网站之Session的生命周期

本文会列出session的属性值、统计指标,重点讲解session几个字段值,虽然session和view、app均有关联,但本文仅从代码层面对session的生命周期做解释。

101 0
|
存储 缓存 JSON
|

可观测系统如何识别网站有多少文件命中了缓存?

文章首发于掘金,属于小众的技术文,讲的是如何判断网站使用的文件是缓存,也就是disk cache ,memory cache 还有304

120 0
|
存储 Prometheus Kubernetes
|

对比开源丨Prometheus 服务多场景存储压测全解析

谁不想要一个省心又好用的监控呢?用数据说话,让我们看看不同集群规模下,阿里云Prometheus 服务Vs开源版本的存储性能压测对比吧!

702 0
|
消息中间件 存储 缓存
|

RocketMQ 5.0 可观测能力升级: Tracing 链路追踪介绍|学习笔记

快速学习 RocketMQ 5.0 可观测能力升级: Tracing 链路追踪介绍

801 0
|
JSON 运维 监控
|

RUM之SPA应用性能的可观测

RUM之SPA应用性能的可观测

338 0
我要发布