开发者社区大数据文章正文

【Spark Summit EU 2016】寻找流式数据中的异常：一种有趣的可伸缩方法

2017-02-13 1858

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自Casey Stella在Spark Summit EU上的演讲，主要介绍了流数据分析和其优缺点以及异常数据分析的方法，还介绍了在分布式计算框架中可以附加到时间序列数据流的混合异常分析方法，并详细介绍了这种可伸缩的异常分析方法的架构设计。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自Casey Stella在Spark Summit EU上的演讲，主要介绍了流数据分析和其优缺点以及异常数据分析的方法，还介绍了在分布式计算框架中可以附加到时间序列数据流的混合异常分析方法，并详细介绍了这种可伸缩的异常分析方法的架构设计。

bb3f5ad906b0d911fdef1d11b6dbb8c119dd4d28

aeb1c6b5a3a1fedd174bc3f7c861ad6279ca4627

3b5b8a4e9f3f32180ab049753f8d522ec63eeaab

0508c0c981af5b0d682be77a8175d7208987ef63

64ac498407a98a08ccd72418330816f931a558ad

0a21e0fe829275426f5ed0781772fff9b75c9511

dad6c831fb21c0e701ee837eab8837e223487362

5c7db2a4fef333203d0efa2a534c98c3068f3776

231261ca54c022248c233e5aace6dcf00ab4dfe8

30daf87cc6e6b9e365ab6665d4eaf7826bcce05b

88c095d001dde0c49421d8105f589345373efebb

447f242fbcf2076de6ce832fd004ecaf5503d780

文章标签：

分布式计算

Spark

关键词：

apache spark数据

apache spark方法

apache spark异常

apache spark数据异常

apache spark流式

小猫吃鱼569

武子康

分布式计算关系型数据库 MySQL

大数据-88 Spark 集群案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL

武子康

203 3 3

vohelon

分布式计算 Java Scala

如何处理 Spark Streaming 的异常情况？

【6月更文挑战第16天】如何处理 Spark Streaming 的异常情况？

vohelon

516 56 56

wljslmz

存储分布式计算 Java

解释 Spark 与数据序列化格式的互操作性

【8月更文挑战第13天】

wljslmz

478 4 4

wljslmz

分布式计算监控大数据

如何处理 Spark 中的倾斜数据？

【8月更文挑战第13天】

wljslmz

935 4 4

wljslmz

存储缓存分布式计算

如何在 Spark 中持久保存数据，有哪些不同的存储级别可用？

【8月更文挑战第13天】

wljslmz

744 4 4

wljslmz

SQL 存储分布式计算

如何使用 Spark SQL 从 DataFrame 查询数据？

【8月更文挑战第13天】

wljslmz

849 4 4

呆呆宝

分布式计算 Apache 数据安全/隐私保护

流计算引擎数据问题之在 Spark Structured Streaming 中水印计算和使用如何解决

呆呆宝

284 1 1

三分钟热度的鱼

分布式计算数据处理流计算

实时计算 Flink版产品使用问题之使用Spark ThriftServer查询同步到Hudi的数据时，如何实时查看数据变化

实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

三分钟热度的鱼

217 1 1

冲冲冲c

弹性计算分布式计算 DataWorks

DataWorks产品使用合集之spark任务如何跨空间取表数据

DataWorks作为一站式的数据开发与治理平台，提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案，帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述，涵盖数据处理的各个环节。

冲冲冲c

166 1 1

三分钟热度的鱼

SQL 分布式计算 HIVE

实时计算 Flink版产品使用问题之同步到Hudi的数据是否可以被Hive或Spark直接读取

三分钟热度的鱼

417 3 3

【Spark Summit EU 2016】寻找流式数据中的异常：一种有趣的可伸缩方法

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【Spark Summit EU 2016】寻找流式数据中的异常：一种有趣的可伸缩方法

热门文章

最新文章

相关课程

相关电子书