Spark的搜索结果_热门_第9页-阿里云开发者社区

那年的坏人

|

博文

spark源码分析之Checkpoint的过程

spark源码分析系列，spark版本1.5.2

# 分布式计算 # Spark # Hadoop # API

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

Hive 终于等来了 Flink

Flink 社区在集成 Hive 功能方面付出很多，目前进展也比较顺利，最近 Flink 1.10.0 RC1 版本已经发布，感兴趣的读者可以进行调研和验证功能。

# 实时计算 Flink版 # SQL # 分布式计算 # Apache # HIVE # 流计算 # Java # Hadoop # API # Maven # Spark

祝威廉

|

博文

StreamingPro 再次支持 Structured Streaming

之前已经写过一篇文章，StreamingPro 支持Spark Structured Streaming，不过当时只是玩票性质的，因为对Spark 2.0+ 版本其实也只是尝试性质的,重点还是放在了spark 1.6 系列的。

# 实时计算 Flink版 # 分布式计算 # Scala # Spark # 流计算 # 数据格式 # JSON # SQL

许鹏

|

博文

Apache Spark技术实战（三）利用Spark将json文件导入Cassandra &SparkR的安装及使用

本文第一部分讲解利用Spark将json文件导入Cassandra；第二部分讲解SparkR的安装及使用。

# JSON # 分布式计算 # NoSQL # Spark # 数据格式 # Shell # 数据库 # Scala # SQL # 机器学习/深度学习

taotao9229

|

博文

小米新一代大数据统计平台大公开

# 云原生大数据计算服务 MaxCompute # 云数据库HBase版 # 分布式计算 # druid # 大数据 # Spark # 流计算 # Hbase # 分布式数据库 # 前端开发 # SQL # 消息中间件

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

Flink Batch SQL 1.10 实践

1.10可以说是第一个成熟的生产可用的Flink Batch SQL版本，它一扫之前Dataset的羸弱，从功能和性能上都有大幅改进，以下我从架构、外部系统集成、实践三个方面进行阐述。

# 实时计算 Flink版 # SQL # 资源调度 # 分布式计算 # Java # 数据库连接 # 调度 # Scala # HIVE # 流计算 # Spark

吴波bruce_wu

|

博文

|

来自：云存储

基于 Tracing 数据的拓扑关系生成原理

背景随着互联网架构的流行，越来越多的系统开始走向分布式化、微服务化。如何快速发现和定位分布式系统下的各类性能瓶颈成为了摆在开发者面前的难题。借助分布式追踪系统的调用链路还原能力，开发者可以完整地了解一次请求的执行过程和详细信息。

# 实时计算 Flink版 # 云消息队列 Kafka 版 # 检索分析服务 Elasticsearch版 # 消息中间件 # Kafka # 分布式计算 # Spark # 流计算

周志湖

|

博文

Spark修炼之道（进阶篇）——Spark入门到精通：第九节 Spark SQL运行流程解析

1.整体运行流程使用下列代码对SparkSQL流程进行分析，让大家明白LogicalPlan的几种状态，理解SparkSQL整体执行流程 // sc is an existing SparkContext. val sqlContext = new org.apache.spark.sql.SQLContext(sc) // this is used to implic

# 云解析DNS # SQL # 分布式计算 # Spark # Scala

技术小甜

|

博文

Databricks缓存提升Spark性能--为什么NVMe固态硬盘能够提升10倍缓存性能（原创翻译）

我们兴奋的宣布Databricks缓存的通用可用性，作为统一分析平台一部分的 Databricks 运行时特性，它可以将Spark工作负载的扫描速度提升10倍，并且这种改变无需任何代码修改。 1、在本博客中，我们将介绍这个新特性的两个主要特点：易用性和性能。

# 存储 # 缓存 # 分布式计算 # Spark # 内存技术

中间件小哥

|

博文

里程碑 | Apache RocketMQ 正式开源分布式事务消息

近日，Apache RocketMQ 社区正式发布4.3版本。此次发布不仅包括提升性能，减少内存使用等原有特性增强，还修复了部分社区提出的若干问题，更重要的是该版本**开源了社区最为关心的分布式事务消息**，而且实现了对外部组件的零依赖。接下来，本文将详细探秘RocketMQ事务消息的设计原理以及实现机制。

# 云消息队列 MQ # 存储 # 消息中间件 # Apache # 数据库 # RocketMQ # 微服务 # 算法 # 流计算 # 分布式计算 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark