开发者社区 问答 正文

【Flink】GROUP BY 数据出现热点、数据倾斜

问题描述
当您发现作业处理的性能很差,提示了资源后性能有也没有明显提升时,可能是数据出现热点、数据倾斜的状况。

展开
收起
李博 bluemind 2018-11-15 13:03:09 7580 分享 版权
1 条回答
写回答
取消 提交回答
  • 云栖社区Java、Redis、MongoDB运营小编,有意合作请联系钉钉:15810436147

    解决方案
    例如:下面一段SQL出现了数据倾斜的问题。

    优化前:

    SELECT
    ID,
    COUNT(distinct NAME)
    FROM AA
    GROUP BY ID;
    优化后: 把上面一段SQL拆分两次做GROUP BY ,第一次是去重操作,第二次是最后的聚合操作。

    CREATE VIEW SSS AS
    SELECT
    ID,
    NAME
    FROM AA
    GROUP BY ID,NAME;
    INSERT INTO SS
    SELECT
    ID,
    COUNT(NAME)
    FROM SSS
    GROUP BY ID;

    2019-07-17 23:14:28
    赞同 展开评论