"CREATE TABLE edu_costomer_hudi( id INT , name STRING, create_time TIMESTAMP, part STRING, primary key(id) not enforced ) PARTITIONED BY (part) with( 'connector'='hudi', 'path'= 'hdfs://192.168.0.39:9000/data/bigdata/hive_data/warehouse/edu_costomer_hudi', 'table.type'= 'MERGE_ON_READ', 'hoodie.datasource.write.recordkey.field'= 'id', 'write.precombine.field'= 'create_time', 'write.tasks'= '1', 'write.rate.limit'= '2000', 'compaction.tasks'= '1', 'compaction.async.enabled'= 'true', 'compaction.trigger.strategy'= 'num_commits', 'compaction.delta_commits'= '1', 'changelog.enabled'= 'true' );从mysql导入20条数据到hadoop CREATE EXTERNAL TABLE edu_hudi.tbl_customer( id
string, name
string, create_time
string)PARTITIONED BY(day_star string)ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' STORED AS INPUTFORMAT 'org.apache.hudi.hadoop.HoodieParquetInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat' LOCATION '/data/bigdata/hive_data/warehouse/edu_customer_hudi'; alter table edu_hudi.tbl_customer add if not exists partition(day_star='2023-03-13') location '/data/bigdata/hive_data/warehouse/edu_customer_hudi/2023-03-13';为什么hive外部表查询不到数据?是因为存储是log 不是parquet 格式? hive怎么配置存储为parquet 格式?"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。