大数据组件kafka测试

简介: 大数据组件kafka测试
kafka是一个事件流平台
  • 什么事件流?,事件流是从事件源实时捕获数据的做法 如数据库、传感器、移动设备、云服务和流形式的软件应用程序 事件; 持久地存储这些事件流以供以后检索; 操作、处理和反应 实时和可追溯​​的事件流; 并将事件流路由到不同的 根据需要使用目标技术。 事件流因此确保了连续的流和解释 数据,以便正确的信息在正确的时间出现在正确的位置。
  • kafka的功能?

    1. 要 发布 (写)和 订阅 (读取)的事件流,包括连续的导入/导出 您来自其他系统的数据。
    2. 持久并可靠存储你想要的事件流
    3. 处理 事件发生时或追溯性 事件流。
    kafka基本概念了解
  • 生产者:生产者 是那些向 Kafka 发布(写入)事件的客户端应用程序
  • 消费者:订阅(读取和处理)这些事件的
  • 主题:主题类似于文件系统中的文件夹,事件就是该文件夹中的文件
  • 分区:主题是 分区的 ,一个主题可以分布在位于不同 Kafka 代理的多个“桶”上。
  • broker:一个 Kafka 服务器也称为 Broker,它接受生产者发送的消息并存入磁盘;Broker 同时服务消费者拉取分区消息的请求,返回目前已经提交的消息一个 Kafka 服务器也称为 Broker,它接受生产者发送的消息并存入磁盘;Broker 同时服务消费者拉取分区消息的请求,返回目前已经提交的消息
kafka功能测试-如何验证数据的一致性和有序性

可以创建一个单分区的Topic,然后自己写一个生产者程序,程序发送的事件流可以从设定值从1到N自增长;写一个消费者程序,单线程消费,将消费到的数据写进文件中,观测有序性;还可以对kafka服务进程直接杀死,进行故障模拟。

kafka性能测试

性能压测是系统性问题,需要考量对整体业务的掌握程序,以及对kafka的熟悉程度。压测过程中涉及压测工具选取,监测kafka,压测结果分析。

  • 明确压测场景:明确要压测的场景
  • 测试环境准备:在服务器选择,kafka版本,kafka架构以及相关配置参数、业务数据等尽可能与线上环境保持一致
  • 压测工具选取:生产者压测使用kafka自带的测试工具kafka-producer-perf-test.sh来进行测试,发送数据推荐使用线上数据导出到本地文件,随机读取进行
  • 压测过程观测:首先开启kafka的JMX端口,①可以使用滴滴的Logikm(但是需要自己搭建部署);②自己通过JMX端口以及官方原生API获取相关指标,CPU、内存、网络等监测可以使用nomn或者top命令来监测
  • 压测结果分析:理想状态是系统资源使用达到瓶颈,如未达到则寻找软件资源瓶颈,配合堆栈分析,发现线程阻塞点。
  • 压测报告呈现:一般有测试环境说明、测试场景说明、测试过程说明、测试结论(在当前场景下的最佳资源使用以及配置)。
相关文章
|
1月前
|
消息中间件 存储 运维
王者归位:Kafka控制器组件解析
王者归位:Kafka控制器组件解析
35 0
|
1月前
|
消息中间件 存储 Java
【Kafka】Kafka 组件分析
【4月更文挑战第5天】【Kafka】Kafka 组件分析
|
4天前
|
消息中间件 分布式计算 大数据
大数据组件之storm简介
大数据组件之storm简介
22 2
|
7天前
|
SQL 分布式计算 资源调度
常用大数据组件的Web端口号总结
这是关于常用大数据组件Web端口号的总结。通过虚拟机名+端口号可访问各组件服务:Hadoop HDFS的9870,YARN的ResourceManager的8088和JobHistoryServer的19888,Zeppelin的8000,HBase的10610,Hive的10002。ZooKeeper的端口包括客户端连接的2181,服务器间通信的2888以及选举通信的3888。
19 2
常用大数据组件的Web端口号总结
|
11天前
|
监控 大数据 数据处理
大数据组件之Storm简介
【5月更文挑战第2天】Apache Storm是用于实时大数据处理的分布式系统,提供容错和高可用的实时计算。核心概念包括Topology(由Spouts和Bolts构成的DAG)、Spouts(数据源)和Bolts(数据处理器)。Storm通过acker机制确保数据完整性。常见问题包括数据丢失、性能瓶颈和容错理解不足。避免这些问题的方法包括深入学习架构、监控日志、性能调优和编写健壮逻辑。示例展示了实现单词计数的简单Topology。进阶话题涵盖数据延迟、倾斜的处理,以及Trident状态管理和高级实践,强调调试、性能优化和数据安全性。
22 4
|
13天前
|
消息中间件 存储 监控
扒开kafka内部组件,咱瞅一瞅都有啥?
以上是 V 哥整理的关于 Kafka 核心组件的介绍,掌握 Kafka 中间件,应用在大型分布式项目中,这对于人个的项目经验积累是浓墨重彩的笔,换句话说,只要是有用到Kafka 的项目,必然是小不了,否则架构师脑袋长泡了。
|
2月前
|
消息中间件 Kafka Linux
Kafka【付诸实践 03】Offset Explorer Kafka 的终极 UI 工具安装+简单上手+关键特性测试(一篇学会使用 Offset Explorer)
【2月更文挑战第21天】Kafka【付诸实践 03】Offset Explorer Kafka 的终极 UI 工具安装+简单上手+关键特性测试(一篇学会使用 Offset Explorer)
246 2
|
4月前
|
分布式计算 大数据 Hadoop
如何对大数据应用进行性能测试
如何对大数据应用进行性能测试
|
4月前
|
消息中间件 关系型数据库 MySQL
探究Kafka原理-7.exactly once semantics 和 性能测试
探究Kafka原理-7.exactly once semantics 和 性能测试
45 0
|
4月前
|
存储 分布式计算 大数据
【大数据分布并行处理】单元测试(八)
【大数据分布并行处理】单元测试(八)
80 1

热门文章

最新文章