开源大数据平台 E-MapReduce的搜索结果_热门

开发者说

|

博文

|

《Apache Spark 中文实战攻略》上下两册电子书重磅来袭，本书集结国内外顶级大厂技术专家，汇集多年实战经验，带你走进全球顶级开源社区之一 Apache Spark，探秘时下最流行的开源分布式内存式大数据处理引擎。

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # 云原生大数据计算服务 MaxCompute # 分布式计算 # Spark # Apache # 大数据 # 容器 # Kubernetes # 数据挖掘 # 机器学习/深度学习 # 算法框架/工具 # 知识图谱

扬流

|

博文

|

来自：大数据与机器学习

深度解析数据湖存储方案Lakehouse架构【Databricks 数据洞察公开课】

从数据仓库、数据湖的优劣势，湖仓一体架构的应用和优势等多方面深度解析Lakehouse架构。

# 开源大数据平台 E-MapReduce # 对象存储 # 日志服务 # 云解析DNS # 存储 # 数据采集 # 机器学习/深度学习 # 分布式计算 # 大数据 # BI # 数据库 # 对象存储 # Spark # 数据格式

扬流

|

博文

|

来自：大数据与机器学习

关于 Data Lake 的概念、架构与应用场景介绍

本文详细介绍了 Data Lake 的概念、架构与应用场景介绍。

# 开源大数据平台 E-MapReduce # 数据管理 # 实时计算 Flink版 # 对象存储 # 云原生大数据计算服务 MaxCompute # 数据湖构建 # 大数据开发治理平台 DataWorks # 云原生数据仓库AnalyticDB MySQL版 # 存储 # 数据采集 # 运维 # 分布式计算 # 大数据 # 数据管理 # MaxCompute # 对象存储 # 流计算 # 数据格式

bigdatatang

|

博文

|

来自：大数据与机器学习

大数据上云存算分离演进思考与探讨-2022

当前大数据上云与存算分离的技术趋势越来越成为行业标准与发展方向。作为大数据商业化的践行者，从存算分离的演进/定义/价值/架构应用/实践/对比等多个维度来分析与探讨其发展历程与组成体系。为大数据存算分离技术整体发展添砖加瓦。

# 云原生大数据计算服务 MaxCompute # 函数计算 # 实时计算 Flink版 # 对象存储 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 弹性伸缩 # 资源管理 # 数据管理 # 容器服务Kubernetes版 # 云原生数据仓库AnalyticDB MySQL版 # 开源大数据平台 E-MapReduce # 存储 # 运维 # 大数据 # 对象存储 # 混合部署

阿里云大数据Al技术

|

博文

|

来自：大数据与机器学习

阿里云 EMR 基于 Apache DolphinScheduler 产品技术实践和社区贡献

本文整理自阿里云 EMR 数据开发团队负责人孙一凡（Evans 忆梵），在 Apache Spark & DS Meetup 的分享

# 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # Cloud Native # 数据可视化 # IDE # 大数据 # 测试技术 # 调度 # 开发工具 # Spark

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

百草味基于“ EMR+Databricks+DLF ”构建云上数据湖的最佳实践

本文介绍了百草味大数据平台从 IDC 自建 Hadoop 到阿里云数据湖架构的迁移方案和落地过程。重点从 IDC 自建集群的痛点分析，云上大数据方案的选型以及核心模块的建设过程几个方面做了详细的介绍，希望给想了解和实践数据湖架构的企业和朋友一个参考。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 数据安全中心 # 存储 # SQL # 分布式计算 # 运维 # 大数据 # Hadoop # 调度 # 对象存储 # 数据安全/隐私保护 # Spark

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

Lakehouse 架构解析与云上实践

本文整理自 DataFunCon 2021大会上，阿里云数据湖构建云产品研发陈鑫伟的分享，主要介绍了 Lakehouse 的架构解析与云上实践。

# 开源大数据平台 E-MapReduce # 数据管理 # 云原生大数据计算服务 MaxCompute # 对象存储 # 实时计算 Flink版 # 云解析DNS # 存储 # SQL # 分布式计算 # 运维 # 数据管理 # 大数据 # 对象存储 # HIVE # Spark # 流计算

bean_stalk

|

博文

|

来自：大数据与机器学习

阿里云EMR Remote Shuffle Service在小米的实践，以及开源

阿里云EMR自2020年推出Remote Shuffle Service(RSS)以来，帮助了诸多客户解决Spark作业的性能、稳定性问题，并使得存算分离架构得以实施，与此同时RSS也在跟合作方小米的共建下不断演进。本文将介绍RSS的最新架构，在小米的实践，以及开源。

# 开源大数据平台 E-MapReduce # 弹性伸缩 # 对象存储 # 存储 # SQL # 缓存 # 分布式计算 # 固态存储 # 测试技术 # 对象存储 # HIVE # Spark # 流计算

扬流

|

博文

|

来自：大数据与机器学习

阿里云 EMR StarRocks VS 开源版本功能差异介绍

阿里云 E-MapReduce Serverless StarRocks 版是阿里云提供的 Serverless StarRocks 全托管服务，提供高性能、全场景、极速统一的数据分析体验，具备开箱即用、弹性扩展、监控管理、慢 SQL 诊断分析等全生命周期能力。内核 100% 兼容 StarRocks，性能比传统 OLAP 引擎提升 3-5 倍，助力企业高效构建大数据应用。本篇文章重点介绍阿里云 EMR StarRocks 与开源 StarRocks 的对比与客户案例。

# 实时计算 Flink版 # 函数计算 # 开源大数据平台 E-MapReduce # 云原生数据仓库AnalyticDB MySQL版 # SQL # 运维 # Serverless # OLAP # BI

蚂蚁数据智能技术

|

博文

|

来自：大数据与机器学习

从数据积累到大模型的智能飞跃，你准备好了吗？

在数据驱动的时代，人工智能（AI）正重塑世界。蚂蚁集团的师文汇在「DATA+AI」论坛上发表演讲，阐述了《数据驱动的AI原生应用与开放框架》。他指出，AI应用经历了从数据积累到大模型的智能飞跃，数据已成为智能应用成功的关键。师文汇强调，构建智能应用需结合优质大模型与行业数据。演讲还介绍了AI原生应用的研发变革与挑战，包括编程模型转变、研发范式的不确定性及与现有系统的交互等问题。此外，他还分享了AI原生应用框架的思考与探索，提出了泛ETL、实验反馈机制及应对不确定性等解决方案，并展示了DB-GPT在政企、金融等多个领域的应用案例。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 人工智能 # 自然语言处理 # BI # 数据处理 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce