开发者社区问答正文

storm是怎么知道去event hub里面获取数据的？

storm是怎么知道去event hub里面获取数据的？本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。https://developer.aliyun.com/article/706511 点击链接欢迎加入感兴趣的技术领域群。

展开

收起

新闻小助手 2019-09-06 11:26:29 1209 版权

阿里云 AI 助理回答

Apache Storm 是一个分布式实时计算系统，用于处理无界和有界数据流。要让 Storm 从 Event Hub（这里假设指的是 Azure Event Hubs，Azure 的一种高可伸缩数据摄入服务）中获取数据，您需要在 Storm 的拓扑中配置一个Spout组件，这个Spout专门负责与Event Hubs交互并读取数据。

以下是实现这一过程的一般步骤：

选择或开发Spout: 首先，您需要一个能够连接到Event Hubs并消费消息的Spout。对于Azure Event Hubs，您可以使用或者自定义一个支持Event Hubs协议的Spout。幸运的是，社区中已经有一些现成的解决方案，比如使用Java编写的EventHubs Spout项目，它可以直接集成到Storm拓扑中。
配置Event Hubs连接信息: 在您的Storm拓扑中配置Spout时，需要提供Event Hubs的连接字符串、事件中心名称等必要的认证信息。这些信息允许Spout建立与Event Hubs服务的安全连接。
设置Spout参数: 根据需求配置Spout的行为，例如并行度（parallelism hint）、消费者组（consumer group）等。消费者组可以帮助您实现数据流的多路复用，即多个Storm拓扑或同一拓扑中的多个Spout实例可以独立地从Event Hubs接收和处理数据。
编写或调整Topology逻辑: 在Storm的Topology中，Spout通常作为数据源，将接收到的数据流传递给Bolt进行进一步处理。您需要根据业务需求设计Topology结构，包括如何处理从Event Hubs来的数据，以及后续的数据处理流程。
部署和运行Topology: 最后，将配置好的Topology提交到Storm集群上运行。Storm会自动管理Spout和Bolt之间的数据流动，从而实现从Event Hubs持续获取数据并进行实时处理的目标。

请注意，具体实现细节可能会根据所使用的Spout实现版本和Storm集群的具体配置有所不同。务必参考最新的文档和示例代码来确保顺利集成。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

流计算开发者

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

storm是怎么知道去event hub里面获取数据的？

相关文章