Spark textFile 和排序-2-阿里云开发者社区

Spark textFile 和排序-2

2021-12-19 165

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习 Spark textFile 和排序-2

开发者学堂课程【大数据实时计算框架 Spark 快速入门：Spark textFile 和排序-2】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/100/detail/1695

Spark textFile 和排序-2

内容简介：

一、相关代码

二、使用 Browse Directory

一、相关代码

1 package com. shsxt. study. core;

2

3 * import java.util.ArrayList;

17

18 public class GroupTopN {

19

20 public static void main(String[] args){

21 SparkConf conf = new SparkConf().setAppName("GroupTopN"). setMaster("local");

22 JavaSparkContext sc =new JavaSparkContext(conf);

23

24 JavaRDD lines = sc.textFile("score.txt");

25 JavaPairRDD pairs = lines

26 .mapToPair(new PairFunction() {

27

28 private static final long serialVersionUID =1L;

29

30 @Override

31 public Tuple2 call(String line)

32 throws Exception {

33 String[] arr = line.split("");

34 return new Tuple2(arr[0], Integer

35 .valueOf(arr[1]));

36 }

37 })

38 JavaPairRDD groupedPairs = pairs

39 . groupByKey();

40 JavaPairRDD top2score = groupedPairs

41 .mapToPair(new PairFunction>, String, Iterable>(){

42

43 private static final long serialVersionUID =1L;

44

45 @Override

46 public Tuple2> call(

47 Tuple2 tuple)

48 throws Exception

49 List list = new ArrayList();

50 Iterable scores . tuple. _2;

51 Iterator it =scores. iterator();

52 while (it.hasNext())

53 Integer score =it.next();

54 list.add(score);

55 }

56 Collections. sort(list, new Comparator(){

57 @override

58 public int compare(Integer ol, Integer o2){

59 return -(o1-o2);

60 }

61 });

62 list = list.sublist(0, 2);

63 return new Tuple2(tuple. _1,

64 list);

Spark textFile 和排序-2

Spark textFile 和排序-2

一、相关代码

二、使用 Browse Directory

阿里云开发者学堂

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark textFile 和排序-2

Spark textFile 和排序-2

一、相关代码

二、使用 Browse Directory

阿里云开发者学堂

热门文章

最新文章

相关课程

相关电子书