开源大数据平台 E-MapReduce的搜索结果_热门

扬流

|

博文

|

来自：大数据与机器学习

EMR StarRocks 测试指南

日前，阿里云 E-MapReduce 与 StarRocks 社区合作，推出了首款 StarRocks 云上产品。同时，面向新老用户提供了99元指定机型（ecs.c6.xlarge）首月试用的优惠活动，欢迎感兴趣的用户前来测试。

# 开源大数据平台 E-MapReduce # 专有网络VPC # 云服务器 ECS # 弹性计算 # 数据挖掘 # 网络安全

hannahc001

|

博文

|

来自：大数据与机器学习

不是吧？这么好用的开源标注工具，竟然还有人不知道…

LabelU是一款专为AI项目设计的强大多模态数据标注工具，支持图像、视频、音频等多样化数据类型。它提供灵活的标注工具与自定义配置选项，让用户根据需求定制高效标注流程。特色功能包括一键载入预标注结果以简化修正工作，以及支持JSON、COCO等多种格式的导出选项。LabelU既可本地部署确保数据安全，也提供在线版本方便快速上手。此外，OpenDataLab还开源了Label-LLM对话标注工具和MinerU文档处理工具，进一步丰富了数据准备的工作流。欢迎访问[LabelU](https://github.com/opendatalab/labelU)了解更多详情，并为这些优秀工具点赞支持！

# 开源大数据平台 E-MapReduce # 人工智能 # JSON # 算法 # 数据处理 # 数据格式

扬流

|

博文

|

来自：大数据与机器学习

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

# 云原生数据仓库AnalyticDB MySQL版 # 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 大数据 # Spark # Apache

扬流

|

博文

|

来自：大数据与机器学习

阿里云 EMR StarRocks VS 开源版本功能差异介绍

阿里云 E-MapReduce Serverless StarRocks 版是阿里云提供的 Serverless StarRocks 全托管服务，提供高性能、全场景、极速统一的数据分析体验，具备开箱即用、弹性扩展、监控管理、慢 SQL 诊断分析等全生命周期能力。内核 100% 兼容 StarRocks，性能比传统 OLAP 引擎提升 3-5 倍，助力企业高效构建大数据应用。本篇文章重点介绍阿里云 EMR StarRocks 与开源 StarRocks 的对比与客户案例。

# 实时计算 Flink版 # 函数计算 # 开源大数据平台 E-MapReduce # 云原生数据仓库AnalyticDB MySQL版 # SQL # 运维 # Serverless # OLAP # BI

扬流

|

博文

|

来自：大数据与机器学习

数据湖架构及概念简介

本文整理自阿里云开源大数据技术专家陈鑫伟在7月17日阿里云数据湖技术专场交流会的分享。

# 开源大数据平台 E-MapReduce # 数据湖构建 # 云原生数据仓库 AnalyticDB PostgreSQL版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # SQL # 分布式计算 # Cloud Native # Hadoop # 大数据 # 对象存储 # HIVE # Spark # 流计算

阿里云大数据

|

7月前

|

博文

|

来自：大数据与机器学习

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台，实现了数据与 AI 技术的有效融合，解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台，最终实现不同场景下整体性能提升50%以上，同时综合成本下降30%。

# 云原生数据仓库AnalyticDB MySQL版 # 云消息队列 Kafka 版 # 开源大数据平台 E-MapReduce # 函数计算 # 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 物联网 # Serverless # Spark

墨祤

|

10天前

|

博文

|

来自：大数据与机器学习

阿里云EMR Serverless StarRocks 内容合集

阿里云 EMR StarRocks 提供存算分离架构，支持实时湖仓分析，适用于多种 OLAP 场景。结合 Paimon 与 Flink，助力企业高效处理海量数据，广泛应用于游戏、教育、生活服务等领域，显著提升数据分析效率与业务响应速度。

# 函数计算 # 开源大数据平台 E-MapReduce # DataWorks # 数据挖掘 # Serverless # OLAP # 流计算

阿里云大数据

|

5月前

|

博文

|

来自：大数据与机器学习

鹰角网络：EMR Serverless Spark 在《明日方舟》游戏业务的应用

鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求，采用阿里云 EMR Serverless Spark 替代原有架构。迁移后实现研发效率提升，支持业务快速发展、计算效率提升，增强SLA保障，稳定性提升，降低运维成本，并支撑全球化数据架构部署。

# 函数计算 # 开源大数据平台 E-MapReduce # SQL # 分布式计算 # Serverless # 调度 # Spark

bean_stalk

|

博文

|

来自：大数据与机器学习

阿里云EMR Remote Shuffle Service在小米的实践，以及开源

阿里云EMR自2020年推出Remote Shuffle Service(RSS)以来，帮助了诸多客户解决Spark作业的性能、稳定性问题，并使得存算分离架构得以实施，与此同时RSS也在跟合作方小米的共建下不断演进。本文将介绍RSS的最新架构，在小米的实践，以及开源。

# 开源大数据平台 E-MapReduce # 弹性伸缩 # 对象存储 # 存储 # SQL # 缓存 # 分布式计算 # 固态存储 # 测试技术 # 对象存储 # HIVE # Spark # 流计算

扬流

|

12月前

|

博文

|

来自：大数据与机器学习

云栖实录 | 阿里云 OpenLake 解决方案重磅发布：多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

阿里云 OpenLake 解决方案重磅发布，构建大数据、搜索、AI 一体化的能力体系，实现多模态数据统一纳管、多种计算引擎平权计算、大数据 AI 一体化开发，助力企业基于数据资产构筑竞争力。

# 云原生数据仓库AnalyticDB MySQL版 # 数据管理 # 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 存储 # 人工智能 # 分布式计算 # 数据管理 # 大数据

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce