开源大数据平台 E-MapReduce的搜索结果_热门

尼不要逗了

|

博文

|

0. 引言今天这篇继续讲流式计算。毫无疑问，Apache Flink 和 Apache Spark （Structured Streaming）现在是实时流计算领域的两个最火热的话题了。那么为什么要介绍 Google Dataflow 呢？Streaming Systems 这本书在分析 Fli...

# 开源大数据平台 E-MapReduce # 实时计算 Flink版 # 分布式计算 # 大数据 # Apache # 流计算 # Spark

bean_stalk

|

博文

|

来自：大数据与机器学习

Spark Codegen浅析

Codegen是Spark Runtime优化性能的关键技术，核心在于动态生成java代码、即时compile和加载，把解释执行转化为编译执行。Spark Codegen分为Expression级别和WholeStage级别，分别针对表达式计算和全Stage计算做代码生成，都取得了数量级的性能提升。本文浅析Spark Codegen技术原理。

# 开源大数据平台 E-MapReduce # Java # 分布式计算 # Spark

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

Lakehouse 架构解析与云上实践

本文整理自 DataFunCon 2021大会上，阿里云数据湖构建云产品研发陈鑫伟的分享，主要介绍了 Lakehouse 的架构解析与云上实践。

# 开源大数据平台 E-MapReduce # 数据管理 # 云原生大数据计算服务 MaxCompute # 对象存储 # 实时计算 Flink版 # 云解析DNS # 存储 # SQL # 分布式计算 # 运维 # 数据管理 # 大数据 # 对象存储 # HIVE # Spark # 流计算

扬流

|

博文

|

来自：大数据与机器学习

阿里云RemoteShuffleService 新功能：AQE 和流控

阿里云EMR 自2020年推出 Remote Shuffle Service(RSS)以来，帮助了诸多客户解决 Spark 作业的性能、稳定性问题，并使得存算分离架构得以实施。为了更方便大家使用和扩展，RSS 在2022年初开源(https://github.com/alibaba/RemoteShuffleService)，欢迎各路开发者共建: )

# 开源大数据平台 E-MapReduce # SQL # 分布式计算 # 负载均衡 # 监控 # 算法 # 测试技术 # Spark # 开发者 # 混合部署 # 索引

Dev-Talk

|

视频

|

来自：大数据与机器学习

EMR StarRocks VS 开源版本功能差异介绍

EMR StarRocks 线上公开课第2期直播亮点Serverless StarRocks 客户案例分享Serverless StarRocks VS 开源版本能力介绍讲师简介弘锐 - 阿里云 E-MapReduce 产品专家

# 开源大数据平台 E-MapReduce

扬流

|

博文

|

来自：大数据与机器学习

Spark+Celeborn：更快，更稳，更弹性

本文整理自阿里云 EMR Spark 团队的周克勇（一锤），在 Spark&DS Meetup 的分享。

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # 对象存储 # 负载均衡 # 存储 # 分布式计算 # Kubernetes # 负载均衡 # 网络性能优化 # Apache # 对象存储 # Spark # 混合部署 # 容器

扬流

|

博文

|

来自：大数据与机器学习

阿里云开源大数据平台E-MapReduce 产品新动态及开源大数据前沿技术分享 2023-2月刊

开源大数据平台 EMR 产品技术月刊，涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解开源大数据最新动态。

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 云原生数据仓库AnalyticDB MySQL版 # 弹性伸缩 # 函数计算 # 密钥管理服务 # SQL # 弹性计算 # 分布式计算 # 运维 # 监控 # 大数据 # Serverless # 数据安全/隐私保护 # HIVE # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Apache Spark中国技术交流社区历次直播回顾（持续更新）

Apache Spark中国技术交流社区，由阿里巴巴开源大数据技术团队成立，持续输出spark相关技术直播、原创文章、精品翻译，钉钉群内千人交流学习，欢迎加入。钉钉入群 https://qr.dingtalk.com/action/joingroup?code=v1,k1,jmHATP9Tk+okK7QZ5sw2oWSNLhkt2lCRvfHRdW7XhUQ=&_dt_no_comment=1&origin=11 更多视频和ppt资料请入群获得。

# 开源大数据平台 E-MapReduce # 表格存储 # 容器服务Kubernetes版 # 实时计算 Flink版 # 云原生大数据计算服务 MaxCompute # 分布式计算 # Spark # 大数据 # Apache # 机器学习/深度学习 # 存储 # 流计算 # SQL # Hadoop # 人工智能

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题发布

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # 可观测监控 Prometheus 版 # 分布式计算 # Prometheus # Kubernetes # 监控 # Cloud Native # 大数据 # Apache # Spark # 流计算 # 容器

扬流

|

博文

|

来自：大数据与机器学习

深度解析数据湖存储方案Lakehouse架构【Databricks 数据洞察公开课】

从数据仓库、数据湖的优劣势，湖仓一体架构的应用和优势等多方面深度解析Lakehouse架构。

# 开源大数据平台 E-MapReduce # 对象存储 # 日志服务 # 云解析DNS # 存储 # 数据采集 # 机器学习/深度学习 # 分布式计算 # 大数据 # BI # 数据库 # 对象存储 # Spark # 数据格式

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce