开源大数据平台 E-MapReduce的搜索结果_热门

bean_stalk

|

博文

|

阿里云EMR Remote Shuffle Service在小米的实践，以及开源

阿里云EMR自2020年推出Remote Shuffle Service(RSS)以来，帮助了诸多客户解决Spark作业的性能、稳定性问题，并使得存算分离架构得以实施，与此同时RSS也在跟合作方小米的共建下不断演进。本文将介绍RSS的最新架构，在小米的实践，以及开源。

# 开源大数据平台 E-MapReduce # 弹性伸缩 # 对象存储 # 存储 # SQL # 缓存 # 分布式计算 # 固态存储 # 测试技术 # 对象存储 # HIVE # Spark # 流计算

蚂蚁数据智能技术

|

博文

|

来自：大数据与机器学习

从数据积累到大模型的智能飞跃，你准备好了吗？

在数据驱动的时代，人工智能（AI）正重塑世界。蚂蚁集团的师文汇在「DATA+AI」论坛上发表演讲，阐述了《数据驱动的AI原生应用与开放框架》。他指出，AI应用经历了从数据积累到大模型的智能飞跃，数据已成为智能应用成功的关键。师文汇强调，构建智能应用需结合优质大模型与行业数据。演讲还介绍了AI原生应用的研发变革与挑战，包括编程模型转变、研发范式的不确定性及与现有系统的交互等问题。此外，他还分享了AI原生应用框架的思考与探索，提出了泛ETL、实验反馈机制及应对不确定性等解决方案，并展示了DB-GPT在政企、金融等多个领域的应用案例。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 人工智能 # 自然语言处理 # BI # 数据处理 # 索引

阿里云大数据

|

1月前

|

博文

|

来自：大数据与机器学习

EMR StarRocks Stella 内核正式发布，登顶 TPC 榜单全球第一

EMR Serverless StarRocks 重磅发布全新企业级版本内核 Stella (StarRocks Efficient and Lightening-fast Lakehouse)，完全兼容开源 StarRocks，为用户提供企业级的产品功能、卓越的性能及稳定性保障。

# 开源大数据平台 E-MapReduce # 存储 # 缓存 # Cloud Native # Serverless # 索引

扬流

|

博文

|

来自：大数据与机器学习

阿里云 EMR StarRocks VS 开源版本功能差异介绍

阿里云 E-MapReduce Serverless StarRocks 版是阿里云提供的 Serverless StarRocks 全托管服务，提供高性能、全场景、极速统一的数据分析体验，具备开箱即用、弹性扩展、监控管理、慢 SQL 诊断分析等全生命周期能力。内核 100% 兼容 StarRocks，性能比传统 OLAP 引擎提升 3-5 倍，助力企业高效构建大数据应用。本篇文章重点介绍阿里云 EMR StarRocks 与开源 StarRocks 的对比与客户案例。

# 实时计算 Flink版 # 函数计算 # 开源大数据平台 E-MapReduce # 云原生数据仓库AnalyticDB MySQL版 # SQL # 运维 # Serverless # OLAP # BI

扬流

|

博文

|

来自：大数据与机器学习

云栖实录 | 阿里云 OpenLake 解决方案重磅发布：多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

阿里云 OpenLake 解决方案重磅发布，构建大数据、搜索、AI 一体化的能力体系，实现多模态数据统一纳管、多种计算引擎平权计算、大数据 AI 一体化开发，助力企业基于数据资产构筑竞争力。

# 云原生数据仓库AnalyticDB MySQL版 # 数据管理 # 开源大数据平台 E-MapReduce # 云原生大数据计算服务 MaxCompute # 存储 # 人工智能 # 分布式计算 # 数据管理 # 大数据

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

Spark 3.0 对于 DATE 和 TIMESTAMP 的改进

本文将会深入介绍DATE和TIMESTAMP

# 开源大数据平台 E-MapReduce # 云解析DNS # SQL # 存储 # 分布式计算 # Java # API # Scala # Apache # 数据库 # Spark # Python

扬流

|

博文

|

来自：大数据与机器学习

Spark+Celeborn：更快，更稳，更弹性

本文整理自阿里云 EMR Spark 团队的周克勇（一锤），在 Spark&DS Meetup 的分享。

# 开源大数据平台 E-MapReduce # 容器服务Kubernetes版 # 对象存储 # 负载均衡 # 存储 # 分布式计算 # Kubernetes # 负载均衡 # 网络性能优化 # Apache # 对象存储 # Spark # 混合部署 # 容器

扬流

|

博文

|

来自：大数据与机器学习

猿辅导基于 EMR StarRocks 的 OLAP 演进之路

猿辅导大数据平台团队负责人申阳分享了猿辅导基于EMR StarRocks 的 OLAP 演进之路。

# 云原生数据仓库AnalyticDB MySQL版 # 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # SQL # 关系型数据库 # MySQL # BI # OLAP # 存储 # 分布式计算 # 监控 # druid # HIVE

墨祤

|

博文

|

来自：大数据与机器学习

基于OpenLake的Flink+Paimon+EMR StarRocks流式湖仓分析

阿里云OpenLake解决方案建立在开放可控的OpenLake湖仓之上，提供大数据搜索与AI一体化服务。通过元数据管理平台DLF管理结构化、半结构化和非结构化数据，提供湖仓数据表和文件的安全访问及IO加速，并支持大数据、搜索和AI多引擎对接。本文为您介绍以Flink作为Openlake方案的核心计算引擎，通过流式数据湖仓Paimon（使用DLF 2.0存储）和EMR StarRocks搭建流式湖仓。

# 云原生数据仓库AnalyticDB MySQL版 # 域名与网站 # 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # 实时计算 Flink版 # 专有网络VPC # SQL # 流计算 # 关系型数据库 # MySQL # 数据库

阿里云大数据

|

10月前

|

博文

|

来自：大数据与机器学习

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台，实现了数据与 AI 技术的有效融合，解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台，最终实现不同场景下整体性能提升50%以上，同时综合成本下降30%。

# 云原生数据仓库AnalyticDB MySQL版 # 云消息队列 Kafka 版 # 开源大数据平台 E-MapReduce # 函数计算 # 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 物联网 # Serverless # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce