“有的放矢”才是性能优化的正确打开方式

简介: “有的放矢”才是性能优化的正确打开方式

1、Kafka 消息发送端监控指标


其实Kafka早就为我们考虑好了,Kafka提供了丰富的监控指标,并提供了JMX的方式来获取这些监控指标,在客户端提供的监控指标如下图所示:

5b8e28a6c9e0766539f80437aa2b0bac.png

主要的监控指标分类如下:


  • producer-metrics
    消息发送端的监控指标,其子节点为该进程下所有的生产者
  • producer-node-metrics
    以Broker节点为维度,每一个发送方的数据指标。
  • producer-topic-metrics
    以topic为维度,统计该发送端的一些指标。

Kafka Producer相关的指标比较多,本文不会一一罗列。


1.1 producer-metrics


producer-metrics是发送端一个非常重要的监控项,如下图所示:

e53e39a643c6f0dccb119530e91c6c55.png

其重点项说明如下:


  • batch-size-avg
    Sender线程实际发送消息时一个批次(ProducerBatch)的平均大小。
  • batch-size-max
    Sender线程时间发送消息时一个批次的最大大小。

实践指导:个人觉得这两个参数非常有必要进行采集,如果该值远小于batch.size设置的值,如果吞吐量不达预期,可以适当调大linger.ms。

  • batch-split-rate
    Kafka提供了对大的ProducerBatch分割成小的机制,即如果客户端的ProducerBatch如果超过了服务端允许的最大消息大小,将会触发在客户端分割重新发送,该值记录每秒切割的速率
  • batch-split-total
    Kafka 发生的 split 次数。

温馨提示:按照笔者对这部分源码的阅读,我觉得ProducerBatch的split的意义不大,因为新分配的ProducerBatch的容量会等于batch.size,未超过该大小,则该Batch不会被分隔,笔者认为该功能大概率无法完成实际的切割意图。


实践指导:如果该值不为0,则表示服务端,客户端设置的消息大小不合理,客户端设置的batch.szie大小应该小于服务端设置的 max.message.bytes,默认值100W字节(约等于1M)

  • buffer-available-bytes
    当前发送端缓存区可用字节大小。
  • buffer-total-bytes
    发送端总的缓存区大小,默认为32M,33,554,432个字节。

实战指导:如果缓存区剩余字节数持续较低,需要评估缓存区大小是否合适,Sender线程遇到了瓶颈,从而考虑网络、Brorker是否遇到瓶颈。

  • bufferpool-wait-ratio
  • bufferpool-wait-time-total
    客户端从缓存区中申请内存用于创建ProducerBatch所阻塞的总时长。

实战指导:如果该值持续大于0,说明发送存在瓶颈,可以适当降低linger.ms的值,让消息有机会得到更加及时的处理。

  • produce-throttle-time-avg
    消息发送被broker限流的平均时间
  • produce-throttle-time-max
    消息发送被broker限流的最大时间
  • io-ratio
    IO线程处理IO读写的总时间
  • io-time-ns-avg
    每一次事件选择器调用IO操作的平均时间(单位为纳秒)
  • io-waittime-total
    io线程等待读写就绪的平均时间(单位为纳秒)
  • iotime-total
    io处理总时间。
  • network-io-rate
    客户端每秒所有连接的网络读写tps。
  • network-io-total
    客户端所有连接上的网络操作(读或写)总数。


1.2 通用指标


Kafka在消息发送端除了上述指标外,还有一些通用类的监控指标,这类指标的统计维度包括:消息发送者、节点、TOPIC三个维度。

5f3ae453f58eb11a1e428841cc4f8da8.png

主要的维度说明如下:


  • producer-metics
    发送端维度
  • producer-node-metrics
    发送端-Broker节点维度
  • producer-topic-metrics
    发送端-主题维度的统计


接下来说明的指标,分别以不同的维度进行统计,但其表示的含义表示一样,故接下来统一说明。


  • incoming-byte-rate
    每秒的入端流量,每秒进入的字节数。
  • incoming-byte-total
    总共进入的字节数。
  • outgoing-byte-total
    总出发送的字节数。
  • request-latency-avg
    消息发送的平均延时。
  • request-latency-max
    消息发送的最大延迟时间。

实战指导:latency-avg与max可以反应消息发送的延迟性能,如果延迟过高,说明Sender线程发送消息存在瓶颈,建议该值与linger.ms进行比较,如果该值显著小于linger.ms,则为了提高吞吐率,可适当调整batch.size的大小

  • request-rate
    每秒发送Tps
  • request-size-avg
    消息发送的平均大小。
  • request-size-max
    Sender线程单次消息发送的最大大小。

实战指导:如果该值迟迟小于max.request.size,说明客户端消息积压的消息不多,如果从其他维度表明遇到了瓶颈,可以适当linger.ms,batch.size,可有效提高吞吐。

  • request-total
    请求发送的总字节数
  • response-rate
    每秒接受服务端响应TPS
  • response-total
    收到服务端响应总数量。


2、监控指标采集


虽然Kafka内置了众多的监控指标,但这些指标默认是存储在内存中,既然是存放在内存中,为了避免监控数据无休止的增加内存触发内存溢出,通常监控数据的存储基本是基于滑动窗口,即只会存储最近一段时间内的监控数据,进行滚动覆盖。


故为了更加直观的展示这些指标,因为需要定时将这些信息进行采集,统一存储在其他数据库等持久化存储,可以根据历史数据绘制曲线,希望实现的效果如下图所示:

3c6dc80ffaf775dbcc637885489d9be6.png

基本的监控采集系统架构设计如下图所示:

1a9bde555cf2149b2e72a933457ea727.png

mq-collect应该是放在生产者SDK中,通过mq-collect类库异步定时将采集信息上传的到时序数据库InfluxDB,然后通过mq-portal门户展示页面,对每一个生产客户端按指标进行可视化展示,实现监控数据的可视化,从而为性能优化提供依据。

相关文章
|
6月前
|
缓存 前端开发 JavaScript
使用Web前端性能优化提高网站加载效率
前端性能优化关键在于提高用户体验和降低资源消耗,Webpack是重要工具。基础优化策略包括减少HTTP请求、资源压缩与缓存、异步加载。Webpack优化配置涉及Tree Shaking、代码分割。高级策略涵盖Long-term Caching、缓存提升和插件优化。打包部署时,自动化流程和环境管理也至关重要。通过这些方法,可提升Web应用速度和体验。
185 0
|
6月前
|
存储 Python
文件缓冲区与I/O性能优化
文件缓冲区与I/O性能优化
79 0
|
6月前
|
缓存 Java Android开发
Android应用性能优化实战
【5月更文挑战第14天】 在竞争激烈的应用市场中,一个流畅、高效的应用能显著提升用户体验并增强用户黏性。本文深入探讨了针对安卓平台进行应用性能优化的策略与实践,从内存管理到多线程处理,再到布局渲染和网络请求的优化,旨在为开发者提供一套全面的优化工具箱。通过分析常见的性能瓶颈并结合最新的Android技术动态,我们不仅讨论理论,还将分享具体的代码示例和改进方法,帮助开发者在实际应用中实现性能提升。
|
6月前
|
缓存 PHP 数据库
PHP程序性能优化指南
在当今互联网快速发展的时代,PHP作为一种流行的服务器端脚本语言,其性能优化显得尤为重要。本文将介绍一些提升PHP程序性能的有效方法,帮助开发者更好地优化他们的代码,提升应用程序的响应速度和效率。
|
6月前
|
设计模式 缓存 Android开发
深入理解Android应用性能优化
【2月更文挑战第18天】在移动开发领域,应用性能是用户体验的关键因素之一。特别是对于安卓设备而言,由于硬件配置的多样性,确保应用在不同设备上都能流畅运行是一项挑战。本文将探讨Android应用的性能优化策略,包括内存管理、UI渲染、多线程处理以及电池效率等方面。通过实例和最佳实践,我们将展示如何诊断性能瓶颈,并提供解决方案来改善应用响应速度和稳定性。
|
存储 缓存 前端开发
浅谈性能优化之图片压缩、加载和格式选择
目前市场上优化图片资源的方式有很多,如压缩图片、选择正确格式、 CDN 加速、懒加载等。
264 0
浅谈性能优化之图片压缩、加载和格式选择
|
Web App开发 缓存 IDE
性能优化,有时候是件体力活
性能优化,有时候是件体力活
267 0
性能优化,有时候是件体力活
|
缓存 算法 程序员
项目优化之性能优化(Unity3D)
如果一个游戏卡死了,它就没有乐趣。本文介绍了一些非常简单的性能改进,为了让玩家满意,每个Unity 开发者都应该知道这些改进。没有人期望你制作一个看起来像AAA+标题的游戏,但是它应该每秒有大量的帧。 注意:当我们谈论在FPS改进环境中,我们总是意味着计算起来很费时间(是什么使我们的CPU变得疯狂)。