一、分布式数据仓库技术架构
二、核心内容解读
(1)分布式数据仓库存储技术:hive+hdfs;
(2)事实计算平台技术框架:spark;
(3)数据挖掘算法技术框架:mllib + sparkR
作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
一、分布式数据仓库技术架构
二、核心内容解读
(1)分布式数据仓库存储技术:hive+hdfs;
(2)事实计算平台技术框架:spark;
(3)数据挖掘算法技术框架:mllib + sparkR
作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。