开发者社区 问答 正文

MaxCompute的SAMPLE函数如何使用

MaxCompute的SAMPLE函数如何使用

展开
收起
提个问题 2024-06-01 10:05:52 58 分享 版权
1 条回答
写回答
取消 提交回答
  • 基于所有读入的column_name的值,系统根据x、y的设置做采样,并过滤掉不满足采样条件的行。

    命令格式

    boolean sample(, , [, [,...]])
    参数说明
    x、y:x必填。BIGINT类型,取值范围为大0的整型常量。表示哈希为x份,取第y份。

    y可选,省略时默认取第一份。如果省略参数中的y,则必须同时省略column_name。

    x、y为其它类型或小于等于0时抛异常,如果y大于x时也返回异常。x、y任一输入为NULL时,返回NULL。

    column_name:可选。采样的目标列。该参数省略时将根据x、y的值随机采样。任意类型,列的值可以为NULL。不做隐式类型转换。如果column_name为常量NULL,则返回报错。

    image.png

    参考文档https://help.aliyun.com/zh/maxcompute/user-guide/sample?spm=a2c4g.11186623.0.i17

    2024-06-01 10:58:47
    赞同 展开评论