Spark的搜索结果_热门_第4页-阿里云开发者社区

寒沙牧

|

博文

|

来自：大数据与机器学习

SparkSQL自适应执行

阿里云EMR-3.13.0版本的SparkSQL支持自适应执行功能，用来解决Reduce个数的动态调整/数据倾斜/执行计划的动态优化问题。

# 开源大数据平台 E-MapReduce # SQL # 调度 # 分布式计算 # Spark

小猪佩佩

|

博文

常见的七种Hadoop和Spark项目案例

大数据中比较火爆的Hadoop、Spark和Storm，最常见的七种项目你们是否已经了解到位了呢，下面一起了解一下吧一、数据整合称之为“企业级数据中心”或“数据湖”，这个想法是你有不同的数据源，你想对它们进行数据分析。

# 存储 # 分布式计算 # 数据中心 # Spark # Hadoop # 流计算 # Hbase # 分布式数据库 # SQL # HIVE

身行

|

博文

专访阿里云高级技术专家吴威：Kafka、Spark和Flink类支持流式计算的软件会越来越流行

大数据领域一定会朝着更加实时、更加智能、数据更加多样化的方向前进。Kafka、Spark和Flink之类的支持流式计算的软件会越来越流行，同时各类机器学习平台和工具也会越来越成熟。

# 云消息队列 Kafka 版 # 实时计算 Flink版 # 云原生大数据计算服务 MaxCompute # 消息中间件 # 分布式计算 # 大数据 # Spark # 流计算 # Hadoop # 运维 # Kafka # 云栖大会 # 弹性计算

云无谓

|

博文

|

来自：大数据与机器学习

[译]利用贝叶斯推理做硬件故障率的准实时预测

你可能已经不知不觉中在数据科学项中用上了贝叶斯相关技术！如果你还没用上，这个技术可以增强你的数据分析能力。本文会展示这项技术在现实世界中的应用案例：通过传感器收集的流式数据预测硬件故障率。

# 开源大数据平台 E-MapReduce # 分布式计算 # 流计算 # Spark # Python

茅草屋11

|

博文

MongoDB迁移方案-冷备份+增量备份恢复--跨机房迁移

# 云数据库 MongoDB 版 # NoSQL # 安全 # MongoDB # 分布式计算 # 数据安全/隐私保护 # Spark # 固态存储 # Hadoop

thinktothings

|

博文

Spark 2.4.0编程指南--Spark SQL UDF和UDAF

## 技能标签 - 了解UDF 用户定义函数（User-defined functions, UDFs） - 了解UDAF （user-defined aggregate function), 用户定义的聚合函数 - UDF示例(统计行数据字符长度) - UDF示例(统计行数据字符转大写) ...

# SQL # 缓存 # 分布式计算 # Apache # Spark # Java # Scala # Hadoop # HIVE

周志湖

|

博文

Spark修炼之道（进阶篇）——Spark入门到精通：第四节 Spark编程模型（一)

作者：周志湖网名：摇摆少年梦微信号：zhouzhihubeyond 本节主要内容 Spark重要概念弹性分布式数据集（RDD）基础 1. Spark重要概念本节部分内容源自官方文档：http://spark.apache.org/docs/latest/cluster-overview.html （1）Spark运行模式目前最为常用的S

# 资源管理 # 分布式计算 # 资源调度 # Hadoop # 调度 # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

11月14日Spark社区直播【 Spark on Kubernetes & YARN】

本次直播将讨论：以Kubernetes为代表的云原生技术越来越流行起来，spark是如何跑在Kubernetes之上来享受云原生技术的红利？ Spark跑在Kubernetes之上和跑在Hadoop YARN上又有什么区别？以及Kubernetes 和YARN的差异点是什么。

# 容器服务Kubernetes版 # 分布式计算 # Spark # 容器 # Kubernetes # 资源调度

轻风_soho

|

博文

Spark集群管理器介绍

Spark可以运行在各种集群管理器上，并通过集群管理器访问集群中的其他机器。 Spark主要有三种集群管理器，如果只是想让spark运行起来，可以采用spark自带的独立集群管理器，采用独立部署的模式；如果是想让Spark部署在其他集群上，各应用共享集群的话，可以采取两

# 分布式计算 # 资源调度 # Hadoop # 调度 # Spark # Apache # 数据安全/隐私保护 # 网络安全 # 存储 # 数据处理

sh_jepson

|

博文

记录CDH Spark2的spark2-submit的一个No such file or directory问题

运行: 在测试的CDH Spark2, 运行spark streaming，命令如下：点击(此处)折叠或打开 spark2-submit \ --class com.

# 分布式计算 # Java # Shell # Apache # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark