HDFS数据源、DStream的持久化存储_ 2|学习笔记-阿里云开发者社区

HDFS数据源、DStream的持久化存储_ 2|学习笔记

2021-12-23 160

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习 HDFS 数据源、DStream 的持久化存储_ 2

开发者学堂课程【大数据实时计算框架 Spark 快速入门：HDFS 数据源、DStream 的持久化存储_ 2】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/100/detail/1723

HDFS 数据源、DStream 的持久化存储_ 2

package com. shsxt. study,streaming;

import java. util. Arrays;[

public class UpdateStateByKeyWordcount {

public static void main(String[]args){

SparkConfconfen—new Sparkconf(). setApplame (“ IpdateStateyWordcount ”).setMas Javastreaming Context jsscsc=new JavaStreamingContext (conf, Durations-seconds(5) js jssc. checkpoint (".");

JavaReceivprInputDStream <String>lines=jssc. socketTextStream ("node24", 8888)]

JavaDStream <String>words=lines.flatMap(new FlatMapFunction <String, String>(){

private static final long serial VersionUID =1L;

@Override

public Iterable<String>call(String line) throws Exception{

return Arrays.asList(line, split(""));

JavaPairDStreamsString ,Integer>pairds.mapIoPair(new Pair function<String, String, Integer/O

private static final long serial VersionUID =1L;

@Override

publicTuple2 <String, Integer>call(String word) throws Exception{return newTuple2<String, Integer>(word,1);

}

});

JavaPainDStreawKtrin ,Integer) wordcounts - pudatestated $Key(new Function? list(integer), Optional.

private static final long se rialVersionUID =1L;

//实际上，对于每个单词，每次 batch 计算的时候，都会调用这个函数，第一个参数 values 相当于这个 batch 中

//这个 key 对应的新的一组值，可能有多个，可能 2 个 1，（xuruyun，1）（xuru yyun,1），那么这个 values 就是（1，1）

//那么第二个参数表示的是这个 key 之前的状态，我们看类型 Integer 就知道了，这里是泛型自己指定的。

HDFS数据源、DStream的持久化存储_ 2|学习笔记

HDFS 数据源、DStream 的持久化存储_ 2

阿里云开发者学堂

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

HDFS数据源、DStream的持久化存储_ 2|学习笔记

HDFS 数据源、DStream 的持久化存储_ 2

阿里云开发者学堂

热门文章

最新文章

相关课程

相关电子书