Spark的搜索结果_热门_第5页-阿里云开发者社区

machongmc

|

博文

### 基本概念 ---------- Spark是一个分布式的内存计算框架，其特点是能处理大规模数据，计算速度快。Spark延续了Hadoop的MapReduce计算模型，相比之下Spark的计算过程保持在内存中，减少了硬盘读写，能够将多个操作进行合并后计算，因此提升了计算速度。同时Spark也提供了更丰富的计算API。 MapReduce是Hadoop和Spark的计算模型，其特点

# 分布式计算 # 资源调度 # 调度 # Spark

祝威廉

|

博文

让CarbonData使用更简单

Apache CarbonData是一种新的高性能数据存储格式，针对当前大数据领域分析场景需求各异而导致的存储冗余问题，CarbonData提供了一种新的融合数据存储方案，以一份数据同时支持“任意维度组合的过滤查询、快速扫描、详单查询等”多种应用场景，并通过多级索引、字典编码、列存等特性提升了IO扫描和计算性能，实现百亿数据级秒级响应。

# 云数据库 RDS MySQL 版 # SQL # 分布式计算 # 关系型数据库 # HIVE # Spark

yq传送门

|

博文

从P4到P9，在马云家写代码到双11前端PM | 11月15号云栖号夜读

今天的首篇文章，讲述了：今年的双11已经是阿里资深前端技术专家舒文来阿里的第11年，从应届生到双11前端PM，他一路升级打怪，实现了岗位上从P4到P9的晋升。这第11届双11顺利结束之际，他把在阿里这些年的成长经历做一个总结和分享，希望你能在他的故事中得到些许启发。

# 前端开发 # Cloud Native # 定位技术 # 双11 # 微服务 # 开发者 # 安全 # 分布式计算 # Spark # Hbase

宜信技术学院

|

博文

数据中台的“自动化数据治理”时代已来

中台，我理解是能力的下沉，数据处理能力下沉为加工平台，数据处理结果下沉为数据资产。那么数据治理能否下沉？可以下沉出什么东西？

# 云原生数据仓库 AnalyticDB PostgreSQL版 # 云原生大数据计算服务 MaxCompute # 数据总线 DataHub # 分布式计算 # 中间件 # 大数据 # Spark # 流计算

eric-li

|

博文

|

来自：大数据与机器学习

通过可视化更好的了解你的Spark应用

图的最大价值是它会推动我们去注意到那些我们从未预料到的东西。 – John Tukey Spark 1.4中对Spark UI进行改进，更加突出可视化的效果。我们来看一下他的主要的改动，主要包含三个方面： Spark事件的时间线视图执行的DAG图 Spark Streaming 的可视化

# 开源大数据平台 E-MapReduce # SQL # 缓存 # 分布式计算 # 数据可视化 # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

是时候放弃 Spark Streaming, 转向 Structured Streaming 了

正如在之前的那篇文章中 Spark Streaming 设计原理中说到 Spark 团队之后对 Spark Streaming 的维护可能越来越少，Spark 2.4 版本的 Release Note 里面果然一个 Spark Streaming 相关的 ticket 都没有。

# 开源大数据平台 E-MapReduce # 云消息队列 Kafka 版 # 实时计算 Flink版 # 存储 # 分布式计算 # API # 流计算 # Spark

寒沙牧

|

博文

|

来自：大数据与机器学习

SparkSQL自适应执行

阿里云EMR-3.13.0版本的SparkSQL支持自适应执行功能，用来解决Reduce个数的动态调整/数据倾斜/执行计划的动态优化问题。

# 开源大数据平台 E-MapReduce # SQL # 调度 # 分布式计算 # Spark

华章计算机

|

博文

Apache Spark机器学习.2.2　数据清洗

# SQL # 数据采集 # 分布式计算 # Apache # Spark

shiyanjuncn

|

博文

Hue安装配置实践

# 云数据库 RDS MySQL 版 # 云数据库HBase版 # SQL # 分布式计算 # Hadoop # 关系型数据库 # HIVE # MySQL # Spark # 数据库 # Hbase # 分布式数据库

青衫无名

|

博文

《Spark 官方文档》Spark配置（二）

# 云消息队列 Kafka 版 # 日志服务 # 缓存 # 分布式计算 # Java # Spark # 流计算 # 资源调度 # 调度 # 数据安全/隐私保护 # 消息中间件 # Kafka

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark