E-MapReduce Kafka Benchmark - I

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 本文介绍如何利用Kafka自带的性能测试脚本测试Kafka集群的性能,文末给出一份单机测试Kafka集群的性能数据。此数据仅供参考,不代表官方性能指标承诺。

0. 测试目的

本文介绍如何利用Kafka自带的性能测试脚本测试E-MapReduce Kafka集群的性能,文末给出一份单机测试Kafka集群的性能数据。此数据仅供参考,不代表官方性能指标承诺。

非特定表述,以下所有Kafka集群指E-MapReduce Kafka集群。

1. 硬件配置

  • Kafka集群
节点 配置 机器数目
Master 非独享 4核16GB 80GB(高效云盘)x 1 1
Core 非独享 16核32GB 500GB(SSD云盘)x 4 10
  • Zookeeper集群
配置 机器数目
非独享 16核32GB 500GB(SSD 云盘)x 1 3

注意:

  • Kafka集群的Master节点主要用来部署一些非Kafka服务应用,例如Kafka-Manager,Zookeeper及Ganglia等等。
  • E-MapReduce当前未提供单独的Zookeeper集群,所以需要手动部署一套独立地Zookeeper集群。
  • 将Kakfa集群默认的ZK指向独立部署的ZK集群。

2. 测试配置

  • 软件版本:

    • Kafka: 0.10.1.0
    • Zookeeper:3.4.6
    • Kafka Manager:1.3.3.7
  • Broker配置

    • num.partitions: 100
    • message.size: 1024 (默认)
    • linger.ms: 0
    • max.request.size: 33554432
    • buffer.memory: 67108864
    • min.insync.replica=2
  • Topic配置:

    • partition数目: 100

3. 测试计划及结果

3.1 测试工具和测试方法

使用Kafka自带测试工具:

  • kafka-producer-perf-test.sh:测试Kafka Producer性能,主要展示发送消息数目,每秒消息发送数目(以及数据量MB),平均延迟(ms),最大延迟(ms),如下所示:
436 records sent, 86.4 records/sec (94.64 MB/sec), 333.9 ms avg latency, 617.0 max latency.
420 records sent, 83.0 records/sec (90.82 MB/sec), 365.9 ms avg latency, 814.0 max latency.
481 records sent, 93.7 records/sec (102.63 MB/sec), 315.2 ms avg latency, 579.0 max latency.
10000 records sent, 87.576410 records/sec (95.88 MB/sec), 325.37 ms avg latency, 1860.00 ms max latency, 370 ms 50th, 575 ms 95th, 779 ms 99th, 1851 ms 99.9th.
  • kafka-consumer-perf-test.sh:测试Kafka Consumer性能

注意:本次测试使用一台机器压测Kafka集群

3.2 固定大小消息的Produce性能

image
image

  • 分析:

    1. 随着Producer数目增加,每秒发送的消息量能够得到近似线性的性能提升。
    2. 增加batch,有助于提高吞吐。batch.size=10000时,producer数目增加对吞吐影响消失,主要是由于达到了机器网卡带宽上限导致。
    3. ack=-1,即提高数据可靠性的同时,会降低集群吞吐能力。所以我们需要根据实际需求在吞吐和可靠性之间做平衡
    4. 随着replicas增加,吞吐率会呈现非线性的下降,这和follow和leader之间需要进行数据同步有关。同样,我们需要根据实际需求在吞吐和可靠性之间做平衡。
  • 附acks说明:

    1. acks=0: Producer不等待来自服务端同步完成的确认,继续发送下一条消息。此配置提供最弱的数据完整性保证,客户端或者服务端的异常都会导致数据丢失,且此时的客户端retries参数失效。
    2. acks=1: Producer等待leader节点成功收到数据并得到确认后发送下一条消息。此配置提供更强的数据完整性保证。
    3. acks=-1(all): Producer等待leader节点和follow节点都确认接收到数据后才算一次发送完成。此配置提供最强的数据完整性保证。此处的follow节点数目受限“min.insync.replicas”参数,需要配置“min.insync.replicas”使用。

3.3 不同大小消息的Produce性能

image

  • 分析:

    1. 消息体越大,每秒发送的消息数量越小,每秒发送的数据量(MB)也基本相应增大。部分测试case由于达到机器网卡带宽上限,所以表现的不明显。
    2. 消息体越大,每次发送的有效数据量就越大,所以适当提高消息体大小,有助于提高发送效率和吞吐。

3.4 消息Consume性能

image

  • 分析:

    1. 单线程即可将机器网卡打满,所以增加线程数目没有带来提升

4. 碰到的问题

  • 问题1:KafkaManager:Yikes! Ask timed out on [ActorSelection[]] after 5000 ms

    • 解决方法1:kafka-manager.api-timeout-millis 调大。
    • 解决方法2:修改Kafka-Manager源码,所有timeout都强行改成10s。
    • 最新版Kafka Manager是否解决了这个问题,未知。

5. 后续

  • 测试D1机型的Kafka集群性能
  • 分布式多机压测Kafka集群
目录
相关文章
|
消息中间件 大数据 Kafka
如何在E-MapReduce上进行Kafka集群间数据复制
本文介绍如何使用社区的Kafka MirrorMaker工具进行集群间的数据复制。
1671 0
|
消息中间件 大数据 测试技术
如何在E-MapReduce上提交Storm作业处理Kafka数据
本文演示如何在E-MapReduce上部署Storm集群和Kafka集群,并运行Storm作业消费Kafka数据。
2822 0
|
存储 消息中间件 大数据
E-MapReduce上如何采集Kafka客户端Metrics
我们知道Kafka提供一套非常完善的Metrics数据,覆盖Broker,Consumer,Producer,Stream以及Connect。E-MapReduce通过Ganglia收集了Kafka Broker metrics信息,可以很好地监控Broker运行状态。
6667 0
|
消息中间件 安全 Kafka
|
2月前
|
消息中间件 存储 运维
为什么说Kafka还不是完美的实时数据通道
【10月更文挑战第19天】Kafka 虽然作为数据通道被广泛应用,但在实时性、数据一致性、性能及管理方面存在局限。数据延迟受消息堆积和分区再平衡影响;数据一致性难以达到恰好一次;性能瓶颈在于网络和磁盘I/O;管理复杂性涉及集群配置与版本升级。
103 1
|
2月前
|
消息中间件 Java Kafka
Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据 进行计算SingleOutputStreamOperatorDataStreamSource
Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据 进行计算SingleOutputStreamOperatorDataStreamSource
62 1
|
4月前
|
消息中间件 Java Kafka
Kafka不重复消费的终极秘籍!解锁幂等性、偏移量、去重神器,让你的数据流稳如老狗,告别数据混乱时代!
【8月更文挑战第24天】Apache Kafka作为一款领先的分布式流处理平台,凭借其卓越的高吞吐量与低延迟特性,在大数据处理领域中占据重要地位。然而,在利用Kafka进行数据处理时,如何有效避免重复消费成为众多开发者关注的焦点。本文深入探讨了Kafka中可能出现重复消费的原因,并提出了四种实用的解决方案:利用消息偏移量手动控制消费进度;启用幂等性生产者确保消息不被重复发送;在消费者端实施去重机制;以及借助Kafka的事务支持实现精确的一次性处理。通过这些方法,开发者可根据不同的应用场景灵活选择最适合的策略,从而保障数据处理的准确性和一致性。
355 9
|
4月前
|
消息中间件 负载均衡 Java
"Kafka核心机制揭秘:深入探索Producer的高效数据发布策略与Java实战应用"
【8月更文挑战第10天】Apache Kafka作为顶级分布式流处理平台,其Producer组件是数据高效发布的引擎。Producer遵循高吞吐、低延迟等设计原则,采用分批发送、异步处理及数据压缩等技术提升性能。它支持按消息键值分区,确保数据有序并实现负载均衡;提供多种确认机制保证可靠性;具备失败重试功能确保消息最终送达。Java示例展示了基本配置与消息发送流程,体现了Producer的强大与灵活性。
74 3
|
4月前
|
vr&ar 图形学 开发者
步入未来科技前沿:全方位解读Unity在VR/AR开发中的应用技巧,带你轻松打造震撼人心的沉浸式虚拟现实与增强现实体验——附详细示例代码与实战指南
【8月更文挑战第31天】虚拟现实(VR)和增强现实(AR)技术正深刻改变生活,从教育、娱乐到医疗、工业,应用广泛。Unity作为强大的游戏开发引擎,适用于构建高质量的VR/AR应用,支持Oculus Rift、HTC Vive、Microsoft HoloLens、ARKit和ARCore等平台。本文将介绍如何使用Unity创建沉浸式虚拟体验,包括设置项目、添加相机、处理用户输入等,并通过具体示例代码展示实现过程。无论是完全沉浸式的VR体验,还是将数字内容叠加到现实世界的AR应用,Unity均提供了所需的一切工具。
172 0
|
4月前
|
消息中间件 存储 关系型数据库
实时计算 Flink版产品使用问题之如何使用Kafka Connector将数据写入到Kafka
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。