开发者社区> 问答> 正文

parquet的元数据刷新具体是什么?

parquet的元数据刷新具体是什么?

展开
收起
游客qzzytmszf3zhq 2021-12-09 20:05:51 404 0
1 条回答
写回答
取消 提交回答
  • Spark SQL为了更好的性能会缓存parquet的元数据。当spark 读取hive表的时候,schema一旦从hive转化为spark sql的,就会被spark sql缓存,如果此时表的schema被hive或者其他外部工具更新,必须要手动的去刷新元数据,才能保证元数据的一致性。

    spark.catalog.refreshTable("my_table")

    2021-12-09 20:06:03
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
大批量处理excel文件到ODPS中方案 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载