备案控制台

开发者社区大数据文章正文

spark学习记录

2023-11-09 45

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： spark学习记录

1、运行spark：在spark目录下执行 bin/spark-shell，进入spark的shell。

2、wordcount的实现：sc.textFile("/input").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect

文章标签：

分布式计算

Spark

Shell

关键词：

apache spark学习

JYeontu

目录

相关文章

孙玉洁-47170

|

8月前

|

分布式计算 API Spark

Spark学习--day05、SparkCore电商网站实操、SparkCore-工程代码

Spark学习--day05、SparkCore电商网站实操、SparkCore-工程代码

孙玉洁-47170

136 11 11

孙玉洁-47170

|

8月前

|

分布式计算并行计算大数据

Spark学习---day02、Spark核心编程（RDD概述、RDD编程（创建、分区规则、转换算子、Action算子））（一）

Spark学习---day02、Spark核心编程 RDD概述、RDD编程（创建、分区规则、转换算子、Action算子））（一）

孙玉洁-47170

416 1 1

孙玉洁-47170

|

8月前

|

SQL 分布式计算 API

Spark学习------SparkSQL（概述、编程、数据的加载和保存）

Spark学习------SparkSQL（概述、编程、数据的加载和保存）

孙玉洁-47170

177 2 2

武子康

|

3月前

|

分布式计算大数据 Java

大数据-87 Spark 集群案例学习 Spark Scala 案例手写计算圆周率、计算共同好友

大数据-87 Spark 集群案例学习 Spark Scala 案例手写计算圆周率、计算共同好友

武子康

87 5 5

武子康

|

3月前

|

分布式计算关系型数据库 MySQL

大数据-88 Spark 集群案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL

大数据-88 Spark 集群案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL

武子康

64 3 3

武子康

|

3月前

|

存储分布式计算算法

大数据-106 Spark Graph X 计算学习案例：1图的基本计算、2连通图算法、3寻找相同的用户

大数据-106 Spark Graph X 计算学习案例：1图的基本计算、2连通图算法、3寻找相同的用户

武子康

86 0 0

LKIDTI数据

|

3月前

|

分布式计算算法 Spark

spark学习之 GraphX—预测社交圈子

spark学习之 GraphX—预测社交圈子

LKIDTI数据

110 0 0

LKIDTI数据

|

3月前

|

分布式计算 Scala Spark

educoder的spark算子学习

educoder的spark算子学习

LKIDTI数据

29 0 0

vohelon

|

4月前

|

分布式计算 Shell Scala

学习使用Spark

学习使用Spark

vohelon

141 3 3

vohelon

|

5月前

|

分布式计算 Shell Scala

如何开始学习使用Spark？

【8月更文挑战第31天】如何开始学习使用Spark？

vohelon

147 2 2

热门文章

最新文章

Spark Operator浅析

Spark中广播变量详解

Spark-spark streaming

spark1.4加载mysql数据创建Dataframe及join操作连接方法问题

利用闪存优化在Cosco基础上的Spark Shuffle

Spark为什么只有在调用action时才会触发任务执行呢（附算子优化和使用示例）？

Spark Shell入门教程（上）

10月17日Spark社区直播【Tablestore Spark Streaming Connector -- 海量结构化数据的实时计算和处理】

领英如何应对Apache Spark的Scalability挑战

Spark Stage切分源码剖析——DAGScheduler

spark用于分析数据并将数据保存到数据库中是

数据分享|Python、Spark SQL、MapReduce决策树、回归对车祸发生率影响因素可视化分析

如何解决Spark在深度学习中的资源消耗问题？

Spark在深度学习中的优缺点是什么？

使用Spark进行机器学习

Spark是一个基于内存的通用数据处理引擎，可以进行大规模数据处理和分析

【Spark】Spark基础教程知识点

DataWorks产品使用合集之在DataWorks中，通过spark访问外网的步骤如何解决

MaxCompute操作报错合集之大数据计算的MaxCompute Spark引擎无法读取到表，是什么原因

MaxCompute操作报错合集之spark3.1.1通过resource目录下的conf文件配置，报错如何解决

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

下一篇

阿里云开通OSS存储服务详细流程