Spark的搜索结果_热门_第2页-阿里云开发者社区

莫源

|

博文

|

来自：云原生

Spark in action on Kubernetes - Spark Operator的原理解析

在上篇文章中，向大家介绍了如何使用Spark Operator在kubernetes集群上面提交一个计算作业。今天我们会继续使用上篇文章中搭建的Playgroud进行调试与解析，帮助大家更深入的理解Spark Operator的工作原理。

# 容器服务Kubernetes版 # 容器计算服务 # 可观测监控 Prometheus 版 # 云解析DNS # 分布式计算 # Spark # 容器 # Perl # Kubernetes

调皮仔3683

|

博文

Hadoop集群中增加与ElasticSearch连接的操作

# 检索分析服务 Elasticsearch版 # 分布式计算 # Java # 大数据 # Hadoop # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

基于Alluxio系统的Spark DataFrame高效存储管理技术

介绍越来越多的公司和组织开始将Alluxio和Spark一起部署从而简化数据管理，提升数据访问性能。Qunar最近将Alluxio部署在他们的生产环境中，从而将Spark streaming作业的平均性能提升了15倍，峰值甚至达到300倍左右。

# 开源大数据平台 E-MapReduce # 存储 # 缓存 # 分布式计算 # 固态存储 # Spark

潭潭

|

博文

|

来自：云存储

表格存储Tablestore权威指南（持续更新）

表格存储本着提升用户体验的思路，打造《表格存储Tablestore权威指南》。为用户提供可借鉴的开发指导、经典案例。经典案例按照场景应用类型划分，目前提供五类场景：元数据、消息数据、轨迹溯源、科学大数据以及物联网；每个类型下都会提供多种经典场景。

# 表格存储 # 云原生大数据计算服务 MaxCompute # 存储 # NoSQL # 大数据 # SQL # 流计算 # 数据管理 # 分布式计算 # Spark # 数据挖掘 # 关系型数据库

machongmc

|

博文

Spark调优经验总结

### 概述 ---------- 本文以Spark实践经验和Spark原理为依据，总结了Spark性能调优的一些方法。这些总结基于Spark-1.0.0版本。对于最近推出的Spark-1.1.0版本，本文介绍了几个版本增强。 ---------- ### Spark性能调优 ---------- #### Executor和分区 ---------- Executor是一个独

# 缓存 # 分布式计算 # Java # Apache # Spark

悟室

|

博文

Spark的调度策略详解

# 分布式计算 # 调度 # Spark

莫源

|

博文

Spark in action on Kubernetes - Playground搭建与架构浅析

### 前言 Spark是非常流行的大数据处理引擎，数据科学家们使用Spark以及相关生态的大数据套件完成了大量又丰富场景的数据分析与挖掘。Spark目前已经逐渐成为了业界在数据处理领域的行业标准。但是Spark本身的设计更偏向使用静态的资源管理，虽然Spark也支持了类似Yarn等动态的资源管理器，但是这些资源管理并不是面向动态的云基础设施而设计的，在速度、成本、效率等领域缺乏解决方案

# 容器服务Kubernetes版 # 分布式计算 # 大数据 # Spark # 容器 # Kubernetes

雅痞士

|

博文

【Spark】Spark常见问题汇总

# 存储 # 分布式计算 # 资源调度 # Java # Spark # Hadoop # 容器 # 文件存储 # 算法 # 调度

云学习小组

|

博文

和封神一起“深挖”Spark

2016云栖大会·北京峰会于8月9号在国家会议中心拉开帷幕，在云栖社区开发者技术专场中，来自阿里云技术专家曹龙（封神）为在场的听众带来《Deep dive into Spark》精彩分享。关于分享者曹龙，花名封神，专注在大数据领域，6年分布式引擎研发经验。先后研发上万台Hadoop、ODPS

# 云服务器 ECS # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # 分布式计算 # Hadoop # 大数据 # Spark # 弹性计算 # SQL # API # 流计算 # 调度

突突修

|

博文

Hive架构优点及使用场景

先阅读初识hive Hive在大数据生态环境中的位置 Hive架构图 client 三种访问方式 1、CLI(hive shell)、command line interface（命令行接口） 2、JDBC/ODBC(ja.

# SQL # 存储 # 大数据 # 数据库 # HIVE # 分布式计算 # 编译器 # Spark # 数据库连接 # Java

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark