一文告诉你为什么时序场景下 TDengine 数据订阅比 Kafka 好

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: 在本文中,TDengine 研发人员详细揭秘了 TDengine 数据订阅的流程和具体实现。

TDengine 3.0 中,我们对流式计算、数据订阅功能都进行了再升级,帮助用户极大简化了数据架构的复杂程度,降低整体运维成本。TDengine 提供的类似消息队列产品的数据订阅、消费接口,本质上是为了帮助应用实时获取写入 TDengine 的数据,或者以事件到达顺序处理数据,与其他消息队列相比,它提供了更大的灵活性,同时有效地降低了传输的数据量与应用的复杂度。


在本篇文章中,TDengine 研发人员详细揭秘了 TDengine 数据订阅的流程和具体实现,给到有需要的人参考。此前我们还在《关于 TDengine 3.0 数据订阅,你需要知道这些》一文中汇总了部分重要的语法规则,如果你正在研究 TDengine 数据订阅功能,可以结合来看。


数据订阅的分类

TDengine 支持多种订阅类型,包括子查询结果订阅、超级表订阅以及整个数据库订阅。超级表订阅和库订阅支持参数 with meta,添加此参数后,订阅的结果将包含数据的 meta 信息,一般用于数据同步迁移。具体语法如下:


  • 列订阅
  1. CREATE TOPIC topic_name as subquery;
  • 库订阅
  1. CREATE TOPIC topic_name as database db_name [with meta];
  • 超级表订阅
  1. CREATE TOPIC topic_name as stable stb_name [with meta];


与 Kafka 对比

一直以来,TDengine 做产品的初衷就是简单易用,因此在做数据订阅功能时,API 全部对标的都是 Kafka。如果有人深入研究过 TDengine 的模型,就会发现它的架构模型和 Kafka 的很多设计都是相对应的,Topic 和 Kafka 相似,Vnode 跟 Kafka 中的 Partition 也很接近,子表的表名跟 Kafka 中的 Event Key 对应,因此这个架构设计天然地就带有消息队列的特点,也正是基于此,TDengine 做数据订阅功能才能如此得心应手。


TDengine 的数据订阅功能与 Kafka 相比,基本概念都是一致的,只是具体实现方式可能有所不同,实现路径如下所示:



在时序数据场景下,TDengine 降低了用户对 Kafka 的依赖,其 Vnode 可以允许不同的消费者同时消费数据,用户只需要订阅自己关注的这部分数据,比如说你只想关注电流里面超限的数据,那你使用 TDengine 进行订阅时的数据传输总量是非常小的,但用 Kafka 进行数据订阅时很可能需要从服务器拉取全部的数据,然后还要在客户端中进行数据筛选,这时两者的性能就完全不在一个量级上了。


TDengine 数据订阅关键参数说明


消费示例代码


TDengine 数据订阅的流程

Client 端的功能

  • 提交 commit
  • 获取 endpoint
  • 心跳 保活
  • 消费数据

client 端在单消费线程里处理逻辑非常简单,无需对资源做并发控制。


Server 端的功能

  • 消费分配控制(rebalance)(c1 表示 comsumer ID,g1 表示 group ID)

该功能通过 timer 控制,每 2s 检测一次是否需要 rebalance,rebalance 后,consumer 需要获取到新的 EP,才可正常消费,否则 consumer ID 将出现不匹配的情况,会重试。


  • 消费状态控制


  • 消费进度控制

结语

TDengine 的数据订阅、流式计算功能优势也体现在企业的具体实践上,以西门子的数字化解决方案改造项目为例,TDengine 帮助其 SIMICAS® OEM 2.0 版本移除了 Flink、Kafka 以及 Redis,大大简化了系统架构,节约了运维成本;在狮桥集团的网货平台与金融 GPS 系统数据架构改造中,部署了 TDengine 之后,直接下线了一整套的末次位置 Redis 集群、轨迹查询的 Hbase 集群也被集体下掉。


如果你也面临着性能和成本难以两全的数据处理难题,亟需升级数据架构,欢迎联系我们,和更专业的解决方案架构师点对点沟通。


关于 TDengine

TDengine 核心是一款高性能、集群开源、云原生的时序数据库Time Series DatabaseTSDB),专为物联网、工业互联网、电力、IT 运维等场景设计并优化,具有极强的弹性伸缩能力。同时它还带有内建的缓存、流式计算、数据订阅等系统功能,能大幅减少系统设计的复杂度,降低研发和运营成本,是一个高性能、分布式的物联网、工业大数据平台。当前 TDengine 主要提供两大版本,分别是支持私有化部署的 TDengine Enterprise 以及全托管的物联网、工业互联网云服务平台 TDengine Cloud,两者在开源时序数据库 TDengine OSS 的功能基础上有更多加强,用户可根据自身业务体量和需求进行版本选择。

目录
相关文章
|
3月前
|
消息中间件 存储 运维
为什么说Kafka还不是完美的实时数据通道
【10月更文挑战第19天】Kafka 虽然作为数据通道被广泛应用,但在实时性、数据一致性、性能及管理方面存在局限。数据延迟受消息堆积和分区再平衡影响;数据一致性难以达到恰好一次;性能瓶颈在于网络和磁盘I/O;管理复杂性涉及集群配置与版本升级。
121 1
|
3月前
|
消息中间件 Java Kafka
Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据 进行计算SingleOutputStreamOperatorDataStreamSource
Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据 进行计算SingleOutputStreamOperatorDataStreamSource
65 1
|
5月前
|
消息中间件 Java Kafka
Kafka不重复消费的终极秘籍!解锁幂等性、偏移量、去重神器,让你的数据流稳如老狗,告别数据混乱时代!
【8月更文挑战第24天】Apache Kafka作为一款领先的分布式流处理平台,凭借其卓越的高吞吐量与低延迟特性,在大数据处理领域中占据重要地位。然而,在利用Kafka进行数据处理时,如何有效避免重复消费成为众多开发者关注的焦点。本文深入探讨了Kafka中可能出现重复消费的原因,并提出了四种实用的解决方案:利用消息偏移量手动控制消费进度;启用幂等性生产者确保消息不被重复发送;在消费者端实施去重机制;以及借助Kafka的事务支持实现精确的一次性处理。通过这些方法,开发者可根据不同的应用场景灵活选择最适合的策略,从而保障数据处理的准确性和一致性。
379 9
|
5月前
|
消息中间件 存储 Java
场景题:如何提升Kafka效率?
场景题:如何提升Kafka效率?
77 0
场景题:如何提升Kafka效率?
|
5月前
|
分布式计算 搜索推荐 物联网
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
大数据及AI典型场景实践问题之通过KafKa+OTS+MaxCompute完成物联网系统技术重构如何解决
|
5月前
|
消息中间件 负载均衡 Java
"Kafka核心机制揭秘:深入探索Producer的高效数据发布策略与Java实战应用"
【8月更文挑战第10天】Apache Kafka作为顶级分布式流处理平台,其Producer组件是数据高效发布的引擎。Producer遵循高吞吐、低延迟等设计原则,采用分批发送、异步处理及数据压缩等技术提升性能。它支持按消息键值分区,确保数据有序并实现负载均衡;提供多种确认机制保证可靠性;具备失败重试功能确保消息最终送达。Java示例展示了基本配置与消息发送流程,体现了Producer的强大与灵活性。
89 3
|
5月前
|
vr&ar 图形学 开发者
步入未来科技前沿:全方位解读Unity在VR/AR开发中的应用技巧,带你轻松打造震撼人心的沉浸式虚拟现实与增强现实体验——附详细示例代码与实战指南
【8月更文挑战第31天】虚拟现实(VR)和增强现实(AR)技术正深刻改变生活,从教育、娱乐到医疗、工业,应用广泛。Unity作为强大的游戏开发引擎,适用于构建高质量的VR/AR应用,支持Oculus Rift、HTC Vive、Microsoft HoloLens、ARKit和ARCore等平台。本文将介绍如何使用Unity创建沉浸式虚拟体验,包括设置项目、添加相机、处理用户输入等,并通过具体示例代码展示实现过程。无论是完全沉浸式的VR体验,还是将数字内容叠加到现实世界的AR应用,Unity均提供了所需的一切工具。
195 0
|
5月前
|
消息中间件 存储 关系型数据库
实时计算 Flink版产品使用问题之如何使用Kafka Connector将数据写入到Kafka
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
5月前
|
消息中间件 监控 Kafka
实时计算 Flink版产品使用问题之处理Kafka数据顺序时,怎么确保事件的顺序性
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
6月前
|
消息中间件 存储 Kafka
kafka 在 zookeeper 中保存的数据内容
kafka 在 zookeeper 中保存的数据内容
61 3