开源大数据平台 E-MapReduce的搜索结果_热门

阿里云大数据

|

2月前

|

博文

|

迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升

迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升，在迁移到 EMR Serverless Spark 之后，TCO 明显下降，平台按作业生命周期弹性拉起与回收，只为实际消耗付费；同时，托管化带来了稳定性与调度效率提升；更关键的是交付确定性提升，大作业整体可提速约 1 小时，报表链路从长尾波动变成更可控的出数节奏。

# 开源大数据平台 E-MapReduce # 存储 # 分布式计算 # 运维 # Serverless # Spark

游客3oewgrzrf6o5c

|

问答

|

来自：大数据与机器学习

想问下，maxcomputer 创建的SQL脚本可以用shell 调用运行吗

# 云原生大数据计算服务 MaxCompute # 开源大数据平台 E-MapReduce # SQL # Shell

阿里云大数据

|

5月前

|

博文

|

来自：大数据与机器学习

有奖实践：EMR Serverless StarRocks × Serverless Spark x DLF 共探 TPC 极致性能

免费试用 EMR Serverless StarRocks 与 EMR Serverless Spark，体验“实时分析冠军”与“批处理之神”的极致性能表现！

# 开源大数据平台 E-MapReduce # 分布式计算 # Serverless # 测试技术 # Spark # 数据挖掘

阿里云大数据

|

2月前

|

博文

|

来自：大数据与机器学习

一套底座支撑多场景：高德地图基于 Paimon + StarRocks 轨迹服务实践

面对轨迹数据“高实时、高并发、长周期存储”的典型特征，高德团队以访问跨度为依据完成热/温/冷分层，并以 Apache Paimon + StarRocks 构建统一的数据底座，支撑轨迹数据的近实时写入与高性能查询。

# 开源大数据平台 E-MapReduce # 存储 # 算法 # 定位技术 # Apache # 流计算

开源大数据EMR

|

博文

|

来自：大数据与机器学习

基于Spark Streaming 进行 MySQL Binlog 日志准实时传输

基本架构 RDS -> SLS -> Spark Streaming -> Spark HDFS 上述链路主要包含3个过程：如何把 RDS 的 binlog 收集到 SLS。如何通过 Spark Streaming 将 SLS 中的日志读取出来，进行分析。

# 云数据库 RDS MySQL 版 # 日志服务 # 开源大数据平台 E-MapReduce # 对象存储 # 分布式计算 # 监控 # 关系型数据库 # Apache # Spark

CiiLii西里网

|

博文

|

来自：大数据与机器学习

阿里巴巴的通义千问大模型

阿里巴巴通义千问是基于Transformer的大型语言模型，预训练于多样化数据集，支持18亿至720亿参数规模。在多模态英文任务中表现出色，且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互，提供智能体验。然而，模型在逻辑题和指令理解上存在不足，需在特定领域进行优化。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 搜索推荐 # 机器人

扬流

|

博文

|

来自：大数据与机器学习

阿里云 EMR StarRocks 在七猫的应用和实践

本文整理自七猫资深大数据架构师蒋乾老师在《阿里云 x StarRocks：极速湖仓第二季—上海站》的分享。

# 实时计算 Flink版 # 云数据库 Tair（兼容 Redis） # 函数计算 # 开源大数据平台 E-MapReduce # 云原生数据仓库AnalyticDB MySQL版 # SQL # 存储 # NoSQL # Redis # HIVE

阿里云大数据

|

博文

|

来自：大数据与机器学习

百观科技基于阿里云 EMR 的数据湖实践分享

百观科技为应对海量复杂数据处理的算力与成本挑战，基于阿里云 EMR 构建数据湖。EMR 依托高可用的 OSS 存储、开箱即用的 Hadoop/Spark/Iceberg 等开源技术生态及弹性调度，实现数据接入、清洗、聚合与分析全流程。通过 DLF 与 Iceberg 的优化、阶梯式弹性调度（资源利用率提升至70%）及倚天 ARM 机型搭配 EMR Trino 方案，兼顾性能与成本，支撑数据分析需求，降低算力成本。

# 开源大数据平台 E-MapReduce # 存储 # 分布式计算 # OLAP # 调度 # Spark

阿里云大数据

|

博文

|

来自：大数据与机器学习

千万级数据秒级响应！碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构，解决了海量数据处理中的资源利用率低、并发能力不足等问题，显著降低了硬件和运维成本。实时查询性能提升8倍，查询出错率减少30倍，集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验，还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

# 函数计算 # 开源大数据平台 E-MapReduce # 存储 # 运维 # Serverless # BI # OLAP

墨祤

|

10月前

|

博文

|

来自：大数据与机器学习

StarRocks+Paimon 落地阿里日志采集：万亿级实时数据秒级查询

A+流量分析平台是阿里集团统一的全域流量数据分析平台，致力于通过埋点、采集、计算构建流量数据闭环，助力业务提升流量转化。面对万亿级日志数据带来的写入与查询挑战，平台采用Flink+Paimon+StarRocks技术方案，实现高吞吐写入与秒级查询，优化存储成本与扩展性，提升日志分析效率。

# 日志服务 # 开源大数据平台 E-MapReduce # 存储 # 缓存 # Apache # 流计算 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce