开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

为什么用flink sql cli去查hive数据,好像比用hive查自身的数据还要慢?

为什么用flink sql cli去查hive数据,好像比用hive查自身的数据还要慢?

展开
收起
真的很搞笑 2023-08-14 21:31:31 120 0
1 条回答
写回答
取消 提交回答
  • 以下是一些可能的原因:

    Flink SQL CLI需要从Hive Metastore中获取表元数据,这可能会导致额外的延迟。
    Flink SQL CLI需要将查询转换为Flink程序,这可能会导致额外的开销。
    Flink SQL CLI需要在Flink集群上启动一个job来执行查询,这可能会导致额外的启动时间。
    你可以尝试以下方法来提高查询性能:

    将查询缓存在Flink集群中,这样下次查询时可以直接从缓存中读取结果,而不需要再次执行查询。
    使用Flink SQL的优化器来优化查询。
    使用Flink SQL的执行计划视图来了解查询的执行计划,并尝试通过调整配置提高性能。
    如果仍然无法提高查询性能,你可以联系Flink用户群或社区论坛寻求帮助。

    2023-09-22 11:34:25
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Hive Bucketing in Apache Spark 立即下载
    spark替代HIVE实现ETL作业 立即下载
    2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载