Spark的搜索结果_热门_第16页-阿里云开发者社区

周志湖

|

博文

Spark修炼之道（高级篇）——Spark源码阅读：第十三节 Spark SQL之SQLContext（一)

作者：周志湖 1. SQLContext的创建 SQLContext是Spark SQL进行结构化数据处理的入口，可以通过它进行DataFrame的创建及SQL的执行，其创建方式如下： //sc为SparkContext val sqlContext = new org.apache.spark.sql.SQLContext(sc) 其对应的源码为： def

# SQL # 分布式计算 # HIVE # Spark # 缓存 # 数据处理

跑呀跑呀

|

博文

【Spark】环境搭建（CentOS7）

1. 首先要安装java8，参考【Linux】Linux服务器（centos7）环境搭建java/python3/nginx 2. 然后安装scala 首先下载scala，解压，然后 vim /etc/profile 在文件末尾添加，把路径换成自己的解压路径 export PATH=$PATH:/usr/local/scala-2.

# 云虚拟主机 # 分布式计算 # Java # Linux # Scala # Spark # Python # 应用服务中间件 # nginx # 虚拟化 # 开发工具

技术小哥哥

|

博文

Hadoop工作流引擎之Azkaban与Oozie对比（四）

# 分布式计算 # Hadoop # 数据库 # 调度 # 数据安全/隐私保护 # Java # 数据格式 # XML # Spark # 关系型数据库

技术mix呢

|

博文

spark的sparkUI如何解读？

# 分布式计算 # 调度 # Spark

六翁

|

博文

Spark机器学习3·推荐引擎(spark-shell)

![](http://img3.douban.com/lpic/s28277325.jpg) [Spark机器学习](http://book.douban.com/subject/26593179/) ### 准备环境 - jblas https://gcc.

# 微服务引擎 # 机器学习/深度学习 # 分布式计算 # Apache # Scala # Spark

许鹏

|

博文

Apache Spark源码走读（六）Task运行期之函数调用关系分析 &存储子系统分析

本篇主要阐述在TaskRunner中执行的task其业务逻辑是如何被调用到的，另外试图讲清楚运行着的task其输入的数据从哪获取，处理的结果返回到哪里，如何返回；以及对存储子系统进行分析。

# 存储 # 分布式计算 # Scala # Spark # 前端开发 # API # 网络架构 # 缓存 # 数据库管理 # 安全

技术小哥哥

|

博文

对于maven创建spark项目的pom.xml配置文件（图文详解）

# 分布式计算 # Java # Apache # Maven # Spark

shiyanjuncn

|

博文

RDD：基于内存的集群计算容错抽象

# 云原生大数据计算服务 MaxCompute # 日志服务 # 云解析DNS # 缓存 # 分布式计算 # Scala # 调度 # Spark

wwwgood2012

|

博文

spark shuffle服务开启

# 分布式计算 # Spark # Hadoop # 资源调度

周志湖

|

博文

Spark Shuffle模块——Suffle Read过程分析

在阅读本文之前，请先阅读Spark Sort Based Shuffle内存分析 Spark Shuffle Read调用栈如下： 1. org.apache.spark.rdd.ShuffledRDD#compute() 2. org.apache.spark.shuffle.ShuffleManager#getReader() 3. org.apache.spar

# 分布式计算 # Spark # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark