Spark的搜索结果_热门_第10页-阿里云开发者社区

元乙

|

博文

|

来自：云存储

IOT/智能设备日志解决方案（3）：上下游对接

当数据从遍布全球的设备端以及服务端采集上来后，最先会到达数据队列。队列承载所有数据的入口和出口，必须具备的两大能力是： * 丰富的上下游对接能力：数据要能从各种方式接入上来，也能够非常容易的对接各个系统。

# 日志服务 # 监控 # 物联网 # 流计算 # 弹性计算 # SQL # 分布式计算 # HIVE # 容器 # Kubernetes # Spark

桃子红了呐

|

博文

sc.textFile("file:///home/spark/data.txt") Input path does not exist解决方法——submit 加参数 --master local 即可解决

# 分布式计算 # Spark

华章计算机

|

博文

《Spark与Hadoop大数据分析》一一1.1　大数据分析以及 Hadoop 和 Spark 在其中承担的角色

# 存储 # 分布式计算 # Apache # 数据库 # Spark

colleen

|

博文

PySpark安装+Jupyter Notebook配置（Ubuntu 18.06）

学校一门Big Data Computing需要学习Spark in Python。这篇文章记录一下安装PySpark和Jupyter Notebook上运行Spark的步骤。

# 分布式计算 # Ubuntu # Spark # Python # Java # Hadoop # 开发工具

thinktothings

|

博文

Spark2.4.0 SparkContext 源码分析

createSparkEnv Started SparkUI 注册端点HeartbeatReceiver createTaskScheduler 启动任务调度器，指定默认任务调度模式FIFO,构建调度池 new DAGScheduler 注册DriverEndpoint端点:Coarse...

# 分布式计算 # 资源调度 # 调度 # Spark # Java # Shell # Hadoop

wsc449

|

博文

Hadoop笔试题一

Hadoop笔试题一一、选择题(2分每题,共20分) 1.下面哪个程序负责 HDFS 数据存储。 A NameNode B Jobtracker C Datanode D tasktracker 2.

# 分布式计算 # Hadoop # 监控 # 大数据 # Spark

知与谁同

|

博文

大数据技术的对决——Spark对Impala对Hive对Presto

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 大数据 # HIVE # Spark # 测试技术

徐雷知行合一

|

博文

Hadoop大数据平台实战(05)：深入Spark Cluster集群模式YARN vs Mesos vs Standalone vs K8s

Hadoop大数据平台实战(05)：Spark Cluster集群模式YARN, Mesos,Standalone和K8s深入对比。监控，调度，监控，安全机制，特性对比，哪个才是最好的Spark集群管理工具。

# 容器服务Kubernetes版 # 云原生大数据计算服务 MaxCompute # 微服务引擎 # 密钥管理服务 # 资源管理 # 分布式计算 # 大数据 # Spark # 容器 # Kubernetes

xy_xin

|

博文

Data Lake 三剑客——Delta、Hudi、Iceberg 对比分析

本文主要从设计出发点、功能支持、性能等方面对比了Delta、Hudi、Iceberg 三个 data lake 方案

# SQL # 存储 # 分布式计算 # 数据管理 # Hadoop # API # 数据库 # HIVE # Spark # 流计算

anzhsoft

|

博文

Spark技术内幕：Master的故障恢复

# 分布式计算 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark