HBase优化之路-合理的使用编码压缩
为什么要讨论HBase编码压缩
编码+压缩能够成倍的减少数据的磁盘占用空间,节省可观的存储费用
编码+压缩通常情况下可以提高系统吞吐率,让系统可以做更多的功
默认建表不启用编码或者压缩,对初学者不友好
了解HBase编码
举个栗子,我们有一张物流表叫"express",记录物流订单的流转详情。
hadoop体系结构杂谈
hadoop体系结构杂谈
今天跟一个朋友在讨论hadoop体系架构,从当下流行的Hadoop+HDFS+MapReduce+Hbase+Pig+Hive+Spark+Storm开始一直讲到HDFS的底层实现,MapReduce的模型计算,到一个云盘如何实现,再到Google分布式史上那最伟大的三篇文章。
使用python的hdfs包操作分布式文件系统(HDFS)
转载请注明出处:@http://blog.csdn.net/gamer_gyt,Thinkagmer 撰写
博主微博:http://weibo.com/234654758 (欢迎互撩)
Github:https://github.