Spark的搜索结果_热门_第11页-阿里云开发者社区

技术小哥哥

|

博文

基于Web的Kafka管理器工具之Kafka-manager启动时出现Exception in thread "main" java.lang.UnsupportedClassVersionError错误解决办法（图文详解）

# 云消息队列 Kafka 版 # 分布式计算 # Java # 大数据 # Hadoop # 消息中间件 # Kafka # 流计算 # Scala # Spark

祝威廉

|

博文

StreamingPro 再次支持 Structured Streaming

之前已经写过一篇文章，StreamingPro 支持Spark Structured Streaming，不过当时只是玩票性质的，因为对Spark 2.0+ 版本其实也只是尝试性质的,重点还是放在了spark 1.6 系列的。

# 实时计算 Flink版 # 分布式计算 # Scala # Spark # 流计算 # 数据格式 # JSON # SQL

anzhsoft

|

博文

从Storm和Spark 学习流式实时分布式计算的设计

# 云消息队列 MQ # 日志服务 # 微服务引擎 # 消息中间件 # 分布式计算 # 算法 # Spark # 流计算

anzhsoft

|

博文

Spark 1.0 开发环境构建：maven/sbt/idea

# 分布式计算 # Java # Maven # Spark # Scala # Apache # Hadoop

abbey_chenxi

|

博文

浅尝批处理系统

# 分布式计算 # Hadoop # 缓存 # 机器学习/深度学习 # 网络协议 # Java # Spark # 监控 # 开发者 # 索引

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

Flink Batch SQL 1.10 实践

1.10可以说是第一个成熟的生产可用的Flink Batch SQL版本，它一扫之前Dataset的羸弱，从功能和性能上都有大幅改进，以下我从架构、外部系统集成、实践三个方面进行阐述。

# 实时计算 Flink版 # SQL # 资源调度 # 分布式计算 # Java # 数据库连接 # 调度 # Scala # HIVE # 流计算 # Spark

吴波bruce_wu

|

博文

|

来自：云存储

基于 Tracing 数据的拓扑关系生成原理

背景随着互联网架构的流行，越来越多的系统开始走向分布式化、微服务化。如何快速发现和定位分布式系统下的各类性能瓶颈成为了摆在开发者面前的难题。借助分布式追踪系统的调用链路还原能力，开发者可以完整地了解一次请求的执行过程和详细信息。

# 实时计算 Flink版 # 云消息队列 Kafka 版 # 检索分析服务 Elasticsearch版 # 消息中间件 # Kafka # 分布式计算 # Spark # 流计算

开源大数据EMR

|

博文

|

来自：大数据与机器学习

【译】Apache Spark 2.4 内置数据源 Apache Avro

原文链接: Apache Avro as a Built-in Data Source in Apache Spark 2.4 Apache Avro 是一种流行的数据序列化格式。它广泛使用于 Apache Spark 和 Apache Hadoop 生态中，尤其适用于基于 Kafka 的数据流场景。

# 开源大数据平台 E-MapReduce # 云消息队列 Kafka 版 # Web App开发 # 分布式计算 # 测试技术 # Apache # Spark

anzhsoft

|

博文

Spark技术内幕：Executor分配详解

# 分布式计算 # 调度 # Spark

祝威廉

|

博文

|

来自：云原生

为什么用Yarn来做Docker容器调度引擎

这篇文章是在一个微信群里和人聊天，然后整理出来的文字。当时Hulu推出了基于Yarn的Docker调度引擎。我正好那段时间也实现了一个类似的，经过交流，发现最后的实现基本是一致的。然而业界用的较多的是Mesos,这篇文章就是为了解释为什么选择用Yarn而不是Mesos来做。

# 资源管理 # 资源调度 # 分布式计算 # 调度 # Docker # 容器 # Hadoop # 数据中心 # Java # Spark # 大数据

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark