Hadoop使用lzo压缩格式

简介: 在hadoop中搭建lzo环境: wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.06.tar.gz   export CFLAGS=-m64   .

在hadoop中搭建lzo环境:

  1. wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.06.tar.gz  
  2. export CFLAGS=-m64  
  3. ./configure -enable-shared -prefix=/usr/local/hadoop/lzo/  
  4. make && make test && make install  

 

在hadoop-env.sh中

export LD_LIBRARY_PATH=/usr/local/hadoop/lzo/lib  

将如下配置到 core-site.xml 中:

<property>  

 <name>io.compression.codecs</name>  

<value>org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec,org.apache.hadoop.io.compress.BZip2Codec</value>  

</property>  

<property>  

   <name>io.compression.codec.lzo.class</name>  

   <value>com.hadoop.compression.lzo.LzoCodec</value>  

</property>  

将如下配置到mapred-site.xml中:

<property>  

    <name>mapred.compress.map.output</name>  

    <value>true</value>  

</property>  

<property>  

    <name>mapred.map.output.compression.codec</name>  

    <value>com.hadoop.compression.lzo.LzoCodec</value>  

</property>  

<property>  

    <name>mapred.child.env</name>  

    <value>LD_LIBRARY_PATH=/usr/local/hadoop/lzo/lib</value>  

</property>  

 



目录
相关文章
|
4月前
|
存储 分布式计算 Hadoop
[hadoop3.x系列]Hadoop常用文件存储格式及BigData File Viewer工具的使用(三)
[hadoop3.x系列]Hadoop常用文件存储格式及BigData File Viewer工具的使用(三)
56 2
|
4月前
|
存储 分布式计算 Hadoop
hadoop中压缩及存储常见格式图解
hadoop中压缩及存储常见格式图解
29 0
|
8月前
|
分布式计算 算法 Hadoop
hadoop当中支持的压缩算法
hadoop当中支持的压缩算法
80 0
|
存储 分布式计算 算法
Hadoop压缩机制及实操
Hadoop压缩机制及实操
165 0
Hadoop压缩机制及实操
|
存储 分布式计算 Linux
基于Hadoop生态系统的一种高性能数据存储格式CarbonData(性能篇)
CarbonData在数据查询的性能表现比Parquet好很多,在写一次读多次的场景下非常适合使用;社区比较活跃,响应也很及时。目前官网发布版本1.3.0与最新的spark稳定版Spark2.2.1集成,增加了支持标准的Hive分区,支持流数据准实时入库等新特性,相信会有越来越多的项目会使用到。
3929 0
|
SQL HIVE 分布式计算
|
分布式计算 Hadoop 测试技术
|
分布式计算 Hadoop Apache
配置Hadoop2.7.2和Hbase1.1.5支持Snappy解压压缩库
一.Hadoop支持Snappy 1.重新编译Hadoop 2.7.2源代码,使其支持Snappy解压压缩库  http://blog.
1703 0

热门文章

最新文章

相关实验场景

更多