Spark的搜索结果_热门_第18页-阿里云开发者社区

dongzhumao

|

博文

熟悉Hadoop的应该就知道HBase和Hive，如果了解这两个组件，那么对于Shark就不会那么陌生了，也就比较容易上手了。 Shark基本上就是在Spark的框架基础上提供和Hive一样的HiveQL命令接口，为了最大程度的保持和Hive的兼容性，Shark使用了 Hive的API来实现query Parsing和 Logic Plan generation，最后的PhysicalPlan execution阶段用Spark代替Hadoop MapReduce。

# SQL # 分布式计算 # 算法 # HIVE # Spark # 数据安全/隐私保护 # Hadoop # 数据挖掘 # 缓存 # API

柏辰爸爸

|

博文

Spark源码分析之六：Task调度（二）

话说在《Spark源码分析之五：Task调度（一）》一文中，我们对Task调度分析到了DriverEndpoint的makeOffers()方法。这个方法针对接收到的ReviveOffers事件进行处理。

# 存储 # 分布式计算 # 调度 # Spark # 索引

明惠

|

博文

|

来自：数据库

Apache Spark Delta Lake 删除使用及实现原理代码解析

Apache Spark Delta Lake 删除使用及实现原理代码解析 Delta Lake 的 Delete 功能是由 0.3.0 版本引入的。在介绍 Apache Spark Delta Lake 实现逻辑之前，我们先来看看如何使用 delete 这个功能。

# 日志服务 # 云解析DNS # 分布式计算 # Spark # Apache

云攻略小攻

|

博文

轻量化AI服务再添两将！阿里云机器学习PAI DSW 2.0 & Alink商业版重磅发布

近日，阿里云推出机器学习PAI两大新品DSW 2.0 & Alink商业版，机器学习PAI产品家族，覆盖了机器学习的数据处理、建模、训练、模型优化、在线预测的全产品线，用户既可以搭建完整的个性化推荐系统，让CTR提高10%+；也可以使用Blade进行深度学习模型进行优化，节省GPU消耗50%。

# 人工智能平台 PAI # 机器学习/深度学习 # SQL # 人工智能 # 弹性计算 # 分布式计算 # 算法 # Cloud Native # Spark # Python # 容器

kill`losmart

|

博文

【求助】scala运行时报错ArrayIndexOutOfBoundsException

# 分布式计算 # Scala # Spark

云栖技术

|

博文

阿里云创建E-MapReduce 3 创建作业

# 对象存储 # Java # 对象存储 # 弹性计算 # 分布式计算 # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Alluxio技术内幕：如何百倍加速云端元数据操作

本文转载自：https://zhuanlan.zhihu.com/p/49499385 我们在这篇文章介绍最新版本（1.8.1版本）的Alluxio如何通过使用指纹特性和底层存储批量操作加快Alluxio元数据操作。

# 开源大数据平台 E-MapReduce # 对象存储 # 存储 # 分布式计算 # 对象存储 # 数据管理 # UED # Spark # 分布式数据库 # 缓存 # API # Web App开发

知与谁同

|

博文

Spark架构在大数据环境的核心位置找到用武之地

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 大数据 # Hadoop # Spark

桃子红了呐

|

博文

深入理解groupByKey、reduceByKey区别——本质就是一个local machine的reduce操作

# 分布式计算 # 算法 # 大数据 # Spark

合禾

|

博文

实时流技术来源及比较

# 云消息队列 Kafka 版 # 消息中间件 # 物联网 # Kafka # 分布式计算 # Java # 关系型数据库 # Oracle # Spark # 监控 # 存储

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark