【Spark Summit East 2017】使用Kafka, Spark, and Kudu构建实时BI系统

简介: 本讲义出自Ruhollah Farchtchi在Spark Summit East 2017上的演讲,主要介绍了在面对处理实时流数据时的一个关键性挑战就是被捕获到的数据的格式不是查询中的最佳解析格式,那么如何构建实时的商业智能系统就成为了一个挑战,本讲义介绍了如何使用Kafka, Spark, and Kudu构建实时BI系统。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Ruhollah Farchtchi在Spark Summit East 2017上的演讲,主要介绍了在面对处理实时流数据时的一个关键性挑战就是被捕获到的数据的格式不是查询中的最佳解析格式,那么如何构建实时的商业智能系统就成为了一个挑战,本讲义介绍了如何使用Kafka, Spark, and Kudu构建实时BI系统。


4e21d7620d4d57d3a780e63912ee65d8641adf84

c41fa69b5e01b3f2f7aa1f84ebb14c85c8e4c66f

9f6373c12dff6abdec1d87f7fa6ee5a489b39c4a

b8e59a4913d20d7728694c6a5f5fc14f5cc44281

cbfd26fe5f6899007b86410a33383f586b0479c4

8fabbbd2a42cea1df62255819473d3e1da5b97f3

956a2bffe539d9816192cca113a4f265bd565599

9cafe52d81febf6b61440b0bf00e95fdf30d1108

51d5a5a91edd6f64c4f9323b2a43a113d6c1f578

85f9a0e970f1d785c568acd9e363a9c1b579e533


12d868c828e5bbd3a1cf15975b8891370edf2b32

520e573e2b3c900a1ab5ce71e8ebf766c178d2c9

1ed3ba32a2b386e03c753d5deb2d3a86b9fc6879

76c6526d847a07172178a91623cb8354ab9470fd
76e73e4ad80c5483b2cfef1197f885f69047f071

5beb9f8772316084fc06b82202f3767e993f2fe2

974b0b3d40d44f78499b9fb1b5d0a5b69dae8962

df6d1884f87026872e3dfd4b2359433de7f3aee5

e10caee9929b360192b1e57acee14a8137d2f3ee



相关文章
|
消息中间件 分布式计算 Kafka
195 Spark Streaming整合Kafka完成网站点击流实时统计
195 Spark Streaming整合Kafka完成网站点击流实时统计
86 0
|
数据可视化 关系型数据库 BI
百度搜索:蓝易云【Redash可视化BI系统部署安装及简单使用】
通过以上步骤,你将成功部署和安装Redash,并可以开始使用它进行数据可视化和BI分析。请注意,上述步骤只是一个简单的示例,实际的部署和配置可能需要更多的步骤和注意事项。你可以参考Redash官方文档以获取更详细的信息和最佳实践。
369 0
|
7月前
|
消息中间件 分布式计算 大数据
【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)
【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)
352 0
|
2月前
|
消息中间件 分布式计算 NoSQL
大数据-104 Spark Streaming Kafka Offset Scala实现Redis管理Offset并更新
大数据-104 Spark Streaming Kafka Offset Scala实现Redis管理Offset并更新
44 0
|
2月前
|
消息中间件 存储 分布式计算
大数据-103 Spark Streaming Kafka Offset管理详解 Scala自定义Offset
大数据-103 Spark Streaming Kafka Offset管理详解 Scala自定义Offset
100 0
|
2月前
|
消息中间件 分布式计算 Kafka
大数据-102 Spark Streaming Kafka ReceiveApproach DirectApproach 附带Producer、DStream代码案例
大数据-102 Spark Streaming Kafka ReceiveApproach DirectApproach 附带Producer、DStream代码案例
58 0
|
5月前
|
人工智能 关系型数据库 分布式数据库
PolarDB产品使用问题之如何将自有BI系统接入NL2BI的Web前端
PolarDB产品使用合集涵盖了从创建与管理、数据管理、性能优化与诊断、安全与合规到生态与集成、运维与支持等全方位的功能和服务,旨在帮助企业轻松构建高可用、高性能且易于管理的数据库环境,满足不同业务场景的需求。用户可以通过阿里云控制台、API、SDK等方式便捷地使用这些功能,实现数据库的高效运维与持续优化。
|
6月前
|
消息中间件 分布式计算 关系型数据库
使用Apache Spark从MySQL到Kafka再到HDFS的数据转移
使用Apache Spark从MySQL到Kafka再到HDFS的数据转移
103 0
|
6月前
|
消息中间件 分布式计算 Kafka
利用Spark将Kafka数据流写入HDFS
利用Spark将Kafka数据流写入HDFS
103 0
|
7月前
|
数据采集 数据可视化 数据挖掘
软件体系结构 - 商业智能系统
软件体系结构 - 商业智能系统
75 1