备案控制台

开发者社区问答正文

通过spark-thriftserver读取hive表执行sql时，tasks 数量怎么设置

我在使用spark-thriftserver的方式，通过beeline执行sql的时候，thriftserver会扫描所查询hive表的所有分区（hdfs上面的路径）然后有多少个路径，就会自动生成多少个task，这个task的数量可以调整吗？或者这个流程怎么优化？

展开

收起

游客iwhrjhvjoyqts 2019-07-05 15:30:22 117038 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

明朔

长期从事大数据系统与产品研发。

可以添加inputformat相关的配置，比如spark.hadoop.mapreduce.input.fileinputformat.split.minsize 不过需要重启下thrift server

2020-03-20 09:24:17

赞同展开评论

问答分类：

SQL HIVE

问答标签：

SQL设置 apache spark SQL spark Hive apache spark Hive SQL hive

问答地址：

开发者社区 > 数据库 > 问答

相关问答

E-MapReduce开启使用DLF统一元数据后本地开发spark程序想访问emr hive中...

93

0

0

通过spark-sql客户端往hive的一个表随便插入一条数据，然后在hive中查询这个表报错.

332

1

0

大数据计算MaxCompute 执行 Hive Sql 时，用的什么引擎啊，是Spark 吗？

136

1

0

E-MapReduce onACK设置spark-pi.yaml的mode为cluster提交...

76

1

0

MaxCompute有没有类似hive hive -e执行sql这种命令

108

1

0

在表格存储中官网的spark这样读取OTS能否设置连接OTS的超时参数？

107

1

0

OneSQL OLAP分析平台在Hive SQL兼容性方面进行了哪些改进？

127

2

0

MaxCompute Spark如何设置日志级别

153

1

0

MaxCompute Spark如何在Dataworks节点设置版本

97

1

0

E-MapReduce在beeline访问thriftserver执行sql查询hive数据报错

154

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

上传文件时提示“Illegal file path”，怎么解决的？

阿里云ESA是什么？边缘安全加速和CDN有什么区别？

阿里云短信收费标准，短信群发平台是怎么收费的？

通义灵码使用代理报错

idea通义灵码插件，更新后怎么一直用英文回答。开始对话时，告诉它之后的问题使用中文回答也不行

相关文章

从 OpenSearch 到 Apache Doris：领创集团日志系统升级实践，降本 45

货拉拉用户画像基于 Apache Doris 的数据模型设计与实践

构建AI智能体：三十四、LangChain SQLDatabaseToolkit终极指南：架构、优势与最佳实践

Quick BI使用案例02：基于人员维度的指定时间段订单分组排序

Quick BI V6.0发布：让人人都能拥有的「超级数据分析师」到底强在哪？

还有其他疑问?