开源大数据平台 E-MapReduce的搜索结果_热门

Lee_tianbai

|

问答

|

来自：大数据与机器学习

数据湖存储OSS是什么？

# 对象存储 # 开源大数据平台 E-MapReduce # 存储 # 对象存储

开源大数据EMR

|

博文

|

来自：大数据与机器学习

基于Spark Streaming 进行 MySQL Binlog 日志准实时传输

基本架构 RDS -> SLS -> Spark Streaming -> Spark HDFS 上述链路主要包含3个过程：如何把 RDS 的 binlog 收集到 SLS。如何通过 Spark Streaming 将 SLS 中的日志读取出来，进行分析。

# 云数据库 RDS MySQL 版 # 日志服务 # 开源大数据平台 E-MapReduce # 对象存储 # 分布式计算 # 监控 # 关系型数据库 # Apache # Spark

jinban998

|

问答

使用E-MapReduce,spark中读取oss文件

# 开源大数据平台 E-MapReduce # 对象存储 # 分布式计算 # 对象存储 # Spark

CiiLii西里网

|

博文

|

来自：大数据与机器学习

阿里巴巴的通义千问大模型

阿里巴巴通义千问是基于Transformer的大型语言模型，预训练于多样化数据集，支持18亿至720亿参数规模。在多模态英文任务中表现出色，且具备多语言对话及图片文本识别能力。可应用于搜索引擎、问答系统和对话交互，提供智能体验。然而，模型在逻辑题和指令理解上存在不足，需在特定领域进行优化。

# 开源大数据平台 E-MapReduce # 自然语言处理 # 搜索推荐 # 机器人

墨祤

|

2月前

|

博文

|

来自：大数据与机器学习

诗悦游戏基于DLF与EMR StarRocks降本38%

诗悦网络（2014年成立）是千人规模的研运一体手游公司，代表作有《长安幻想》《永夜降临》等。为支撑PB级开放世界新游《望月》，其原半托管StarRocks数据平台面临高成本、难运维、稳定性差等痛点。阿里云以Serverless StarRocks+DLF Paimon数据湖方案实现存算分离、多租户隔离与全托管运维，总成本降38%，查询性能提升40%+，RPO=0，全面赋能实时/近实时/离线场景。

# 开源大数据平台 E-MapReduce # 存储 # 运维 # 分布式计算 # DataWorks # Serverless

开源大数据EMR

|

博文

|

来自：大数据与机器学习

JindoFS概述：云原生的大数据计算存储分离方案

JindoFS 是一套新的云原生的数据湖解决方案。在 JindoFS 之前，云上客户主要使用 HDFS 和 OSS/S3 作为大数据存储。HDFS 是 Hadoop 原生的存储系统，10 年来，HDFS 已经成为大数据生态的存储标准，但是我们也可以看到 HDFS 虽然不断优化，但是 JVM 的瓶颈也始终无法突破。

# 云原生大数据计算服务 MaxCompute # 块存储 # 对象存储 # 开源大数据平台 E-MapReduce # 存储 # 缓存 # 分布式计算 # 大数据 # 对象存储

扬流

|

博文

|

来自：大数据与机器学习

重磅发布！阿里云全链路数据湖开发治理解决方案

阿里云重磅发布全链路数据湖解决方案，主要包含开源大数据平台E-MapReduce(EMR) + 一站式大数据数据开发治理平台DataWorks + 数据湖构建DLF + 对象存储OSS等核心产品。

# 开源大数据平台 E-MapReduce # 弹性伸缩 # 数据安全中心 # 对象存储 # 云原生大数据计算服务 MaxCompute # 大数据开发治理平台 DataWorks # 数据集成 Data Integration # 数据采集 # SQL # 弹性计算 # 运维 # 分布式计算 # DataWorks # 数据可视化 # 大数据 # 调度 # 对象存储

阿里云大数据

|

12月前

|

博文

|

来自：大数据与机器学习

千万级数据秒级响应！碧桂园基于 EMR Serverless StarRocks 升级存算分离架构实践

碧桂园服务通过引入 EMR Serverless StarRocks 存算分离架构，解决了海量数据处理中的资源利用率低、并发能力不足等问题，显著降低了硬件和运维成本。实时查询性能提升8倍，查询出错率减少30倍，集群数据 SLA 达99.99%。此次技术升级不仅优化了用户体验，还结合AI打造了“一看”和“—问”智能场景助力精准决策与风险预测。

# 函数计算 # 开源大数据平台 E-MapReduce # 存储 # 运维 # Serverless # BI # OLAP

寒沙牧

|

博文

|

来自：大数据与机器学习

HBase写性能优化

本文介绍了三种HBase数据写入的方法（1种多线程，2种mapreduce），并介绍了各类性能调优的方法

# 云数据库HBase版 # 开源大数据平台 E-MapReduce # 分布式计算 # 大数据 # 分布式数据库 # API # Hbase

阿里云E-MapReduce团队

|

博文

|

来自：大数据与机器学习

超详攻略！Databricks 数据洞察 - 企业级全托管 Spark 大数据分析平台及案例分析

5分钟读懂 Databricks 数据洞察 ~ 更多详细信息可登录 Databricks 数据洞察产品链接：https://www.aliyun.com/product/bigdata/spark（当前产品提供￥599首购试用活动，欢迎试用！）

# 开源大数据平台 E-MapReduce # 云数据库 RDS MySQL 版 # 云原生大数据计算服务 MaxCompute # 对象存储 # 存储 # 机器学习/深度学习 # 人工智能 # 分布式计算 # 大数据 # 数据挖掘 # BI # 调度 # 对象存储 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据平台 E-MapReduce