《Storm分布式实时计算模式》——3.2　Trident topology-阿里云开发者社区

《Storm分布式实时计算模式》——3.2　Trident topology

2017-07-03 1291

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自华章计算机《Storm分布式实时计算模式》一书中的第3章，第3.2节,作者：（美）P. Taylor Goetz　Brian O’Neill 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.2　Trident topology

为了满足这些需求，我们需要在topology中对疾病的发生进行统计。使用标准的Storm topology进行统计会遇到难题，因为tuple可能重复发送，这会导致重复计数的问题。下一节将会看到，Trident提供了操作原语来解决这个问题。
我们将使用的topology，如图3-1所示。
上述topology的代码如下：

ba3180aa11462bdd8e15d929f470895871b6e135

https://yqfile.alicdn.com/8f3ccc00d201386cd2c7e54e6d2b24079f053405.png
" >

faed3942e6aa21f4b3ca2e11c2697773aebf9916

https://yqfile.alicdn.com/341cd03b37714b631310fa1860e594409d79b95a.png" >

上述代码表现了不同Trident函数之间的布局关联方式。首先，DiagnosisEventSpout函数发射疾病事件。然后事件由DiseaseFilter函数过滤，过滤掉我们不关心的疾病事件。之后，事件由CityAssignment函数赋值一个对应的城市名。然后HourAssignment函数赋值一个表示小时的时间戳，并且增加一个key cityDiseaseHour到tuple的字段中，这个key包括城市、小时和疾病代码。后续就使用这个key进行分组统计并使用persistAggregate函数对统计量持久性存储。统计量传递给OutbreakDetector函数，如果统计量超过阈值，OutbreakDetector向后发送一个告警信息。最后DispatchAlert接收到告警信息，记录日志，并且结束流程。在后面，我们会深入了解每个步骤。

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。

《Storm分布式实时计算模式》——3.2　Trident topology

3.2　Trident topology

华章出版社

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

《Storm分布式实时计算模式》——3.2 Trident topology

3.2 Trident topology

华章出版社

热门文章

最新文章

相关课程

相关电子书

相关实验场景

《Storm分布式实时计算模式》——3.2　Trident topology

3.2　Trident topology