开源大数据周刊-第67期
开源大数据EMR
2017-09-14
2733浏览量
简介:
资讯:
技术
-
kafka数据可靠性深度解读
本文首先从Kafka的架构着手,先了解下Kafka的基本原理,然后通过对kakfa的存储机制、复制原理、同步原理、可靠性和持久性保证等等一步步对其可靠性进行分析,最后通过benchmark来增强对Kafka高可靠性的认知。。
-
Spark 1.6升级2.x防踩坑指南
本文以SQL模块为主,扒一扒Spark升级2.x过程中可能会踩到的坑。
-
深入解析Spark中的RPC
Spark是一个快速的、通用的分布式计算系统,而分布式的特性就意味着,必然存在节点间的通信。本文主要介绍不同的Spark组件之间是如何通过RPC(Remote Procedure Call) 进行点对点通信
-
链家大数据多维分析引擎实践
大数据背景下,传统关系型多维分析 ROLAP 引擎遇到极大挑战,因而链家转向基于 Hadoop 生态的 MOLAP(Kylin)及 HOLAP (多引擎)。本文分享了链家在多维分析引擎方面的一些实践经验,主要从 OLAP 的背景和简介、链家多维分析架构演进和展望、OLAP 平台链路优化这三部分来介绍
欢迎入群技术交流!


云HBase微信交流群请加:g418615
版权声明:信息都是来自互联网,如果侵权,请联系我们,我们负责删除。
阿里云E-Mapreduce团队出品
消息中间件
人工智能
分布式计算
大数据
Spark
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。