开发者社区> 问答> 正文

Spark 当中数据倾斜具体应该是什么意思呢?

Spark 当中数据倾斜具体应该是什么意思呢?

展开
收起
游客ahv54x37wvm7u 2021-12-12 20:52:26 599 0
1 条回答
写回答
取消 提交回答
  • 对 Spark/Hadoop 这样的大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。数据倾斜指的是,并行处理的数据集中,某一部分(如 Spark 或 Kafka 的一个 Partition)的数据显著多于其它部分,从而使得该部分的处理速度成为整个数据集处理的瓶颈(木桶效应)

    2021-12-12 20:52:38
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载