业务场景:
做数据分析的时候,经常会用到hive -e "sql" > result.csv,然后将结果导入到excel中,可是使用hive -e
导出后默认的分隔符是\t
,excel无法识别,所以需要将\t
转成,
方案一:使用linux管道符替换
hive -e "select * from table_name limit 100" | sed 's/\t/,/g' > result.csv
或者
hive -e "select * from table_name limit 100" | tr "\t" "," > result.csv
方案二:使用hive的insert语法导出文件
insert overwrite local directory '/home/hadoop/20180303'
row format delimited
fields terminated by ','
select * from table_name limit 100