开发者社区> 问答> 正文

客户在使用ODPS SQL插入数据至一张表时,发现该表默认的分区数较少,影响下游Spark任务...

已解决

客户在使用ODPS SQL插入数据至一张表时,发现该表默认的分区数较少,影响下游Spark任务的运行速度。客户询问如何指定ODPS SQL插入表时的分区数。

展开
收起
提个问题! 2024-10-11 12:25:24 6 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    采纳回答

    问题原因是客户的下游Spark任务受限于ODPS SQL插入表的分区数过少,导致资源未充分利用且运行缓慢。客户希望将分区数从6提升到100。然而,经过交流,客服确认ODPS SQL无法直接控制写入表的分区数,这取决于客户在创建表时的规划以及后续的DDL语句操作。

    2024-10-11 12:25:25
    赞同 5 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载