开发者社区> 问答> 正文

writePartitionFile方法对input files取样的方式是什么?

writePartitionFile方法对input files取样的方式是什么?

展开
收起
芯在这 2021-12-06 22:16:51 204 0
1 条回答
写回答
取消 提交回答
  • 有三种取样方法:

    1. RandomSampler 随机取样

    2. IntervalSampler 从s个split里面按照一定间隔取样,通常适用于有序数据

    3. SplitSampler 从s个split中选取前n条记录取样

    2021-12-06 22:17:04
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
OPEN SOURCE IN A DATA-DRIVEN WORLD 立即下载
数据采集:日志数...[jing.luojing].1477375627.pdf 立即下载
Sparksheet - Transforming Spreadsheets into Spark Data Frames 立即下载