开发者社区> 问答> 正文

Hadoop中二次排序如何自定义排序类?

Hadoop中二次排序如何自定义排序类?

展开
收起
真的很搞笑 2021-12-05 15:12:27 215 0
1 条回答
写回答
取消 提交回答
  •  这是Key的第二次比较,对所有的Key进行排序,即同时完成IntPair中的first和second排序。该类是一个比较器,可以通过两种方式实现。

       1) 继承WritableComparator。

    public static class KeyComparator extends WritableComparator   必须有一个构造函数,并且重载以下方法。

    public int compare(WritableComparable w1, WritableComparable w2)   2) 实现接口 RawComparator。

      上面两种实现方式,在Job中,可以通过setSortComparatorClass()方法来设置Key的比较类。

    job.setSortComparatorClass(KeyComparator.Class);

    2021-12-05 15:12:42
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
《构建Hadoop生态批流一体的实时数仓》 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载
CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载