MaxCompute的SAMPLE函数如何使用
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
基于所有读入的column_name的值,系统根据x、y的设置做采样,并过滤掉不满足采样条件的行。
命令格式
boolean sample(, , [, [,...]])
参数说明
x、y:x必填。BIGINT类型,取值范围为大0的整型常量。表示哈希为x份,取第y份。
y可选,省略时默认取第一份。如果省略参数中的y,则必须同时省略column_name。
x、y为其它类型或小于等于0时抛异常,如果y大于x时也返回异常。x、y任一输入为NULL时,返回NULL。
column_name:可选。采样的目标列。该参数省略时将根据x、y的值随机采样。任意类型,列的值可以为NULL。不做隐式类型转换。如果column_name为常量NULL,则返回报错。
参考文档https://help.aliyun.com/zh/maxcompute/user-guide/sample?spm=a2c4g.11186623.0.i17