开源大数据平台 E-MapReduce的搜索结果_热门

阿里云大数据

|

10月前

|

博文

|

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台，实现了数据与 AI 技术的有效融合，解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台，最终实现不同场景下整体性能提升50%以上，同时综合成本下降30%。

# 云原生数据仓库AnalyticDB MySQL版 # 云消息队列 Kafka 版 # 开源大数据平台 E-MapReduce # 函数计算 # 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # 物联网 # Serverless # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Spark SQL 性能优化再进一步：CBO 基于代价的优化

本文将介绍 CBO，它充分考虑了数据本身的特点（如大小、分布）以及操作算子的特点（中间结果集的分布及大小）及代价，从而更好的选择执行代价最小的物理执行计划，即 SparkPlan。

# 开源大数据平台 E-MapReduce # SQL # 分布式计算 # 大数据 # Spark

我是搞电商ap接口的

|

博文

|

来自：大数据与机器学习

小红书 API 接口使用指南：笔记详情数据接口的接入与使用

小红书是一款广受喜爱的生活方式分享社交平台，涵盖旅行、美食等领域。其API允许开发者批量获取笔记内容、图片链接及用户互动数据，助力内容分析与营销策略优化。要使用API，需先注册开发者账号并通过认证获取密钥；随后依据官方文档构建与发送HTTP请求，最后处理JSON格式响应数据。整个过程中，请务必遵循平台使用条款，尊重用户隐私权。

# 开源大数据平台 E-MapReduce # JSON # API # 开发者 # 数据格式 # Python

阿里云大数据

|

12天前

|

博文

|

来自：大数据与机器学习

活动报名 | Apache Spark Meetup · 上海站，助力企业构建高效数据平台

2025年12月20日，上海 · 阿里巴巴徐汇滨江园区，Apache Spark Meetup 助力企业构建高效数据平台，欢迎报名！

# 开源大数据平台 E-MapReduce # 分布式计算 # Serverless # 数据处理 # Apache # Spark

开源大数据EMR

|

博文

|

来自：大数据与机器学习

Delta Lake，让你从复杂的Lambda架构中解放出来

Linux 基金会的 Delta Lake（Delta.io）是一个给数据湖提供可靠性的开源存储层软件。在 QCon 全球软件开发大会（上海站）2019 的演讲中，Databricks 公司的 Engineering Manager 李潇带我们了解了 Delta Lake 在实际生产中的应用与实践以及未来项目规划，本文便整理自此次演讲。