开发者社区> 问答> 正文

Flink高性能DISTINCT函数

已解决

Flink高性能DISTINCT函数

展开
收起
阿里云服务支持 2022-12-19 11:07:46 236 0
2 条回答
写回答
取消 提交回答
  • 官方回答

    Flink支持MiniBatch或Local-Global等优化,需使用APPROX_COUNT_DISTINCT函数,详情请参考APPROX_COUNT_DISTINCT

    2022-12-19 11:11:32
    赞同 展开评论 打赏
  • 十年摸盘键,代码未曾试。 今日码示君,谁有上云事。

    DISTINCT函数,隶属于“筛选”类函数。微软将其划分为两种模式,列与表模式。 这个函数的主要用途是去除表或列中的重复项。或者可以称为高效去重。 DISTINCT可以使用表达式作为参数,DISTINCT去掉重复值计数时,不会考虑重复项目; DISTINCT返回的结果去掉重复项,且去掉空值。

    2022-12-19 11:19:50
    赞同 1 展开评论 打赏
来源圈子
更多
收录在圈子:
作为全球云计算的领先者,阿里云为全球230万企业提供着云计算服务,服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务,给用户带来极速愉悦的服务体验。
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载