Spark的搜索结果-阿里云开发者社区

Echo_Wish

|

2天前

|

博文

|

来自：大数据与机器学习

别让大数据“全表扫描”掏空你：数据分区策略与分区裁剪的实战心经

# SQL # 存储 # 分布式计算 # 大数据 # Spark

Echo_Wish

|

7天前

|

博文

|

来自：大数据与机器学习

数据湖不是湖，是江湖：Delta Lake / Iceberg / Hudi 到底该选谁？

# SQL # 分布式计算 # 架构师 # 关系型数据库 # Spark

Echo_Wish

|

9天前

|

博文

|

来自：大数据与机器学习

别再把数据管道当“体力活”了：从单体任务到事件驱动的升级之路

# 数据采集 # 分布式计算 # 监控 # 流计算 # Spark

阿里云大数据

|

10天前

|

博文

|

来自：大数据与机器学习

活动报名 | Apache Spark Meetup · 上海站，助力企业构建高效数据平台

2025年12月20日，上海 · 阿里巴巴徐汇滨江园区，Apache Spark Meetup 助力企业构建高效数据平台，欢迎报名！

# 开源大数据平台 E-MapReduce # 分布式计算 # Serverless # 数据处理 # Apache # Spark

Echo_Wish

|

15天前

|

博文

|

来自：大数据与机器学习

Spark 批处理调优这点事：资源怎么要、Shuffle 怎么省、序列化怎么选？我用这些年踩过的坑告诉你

# 分布式计算 # 资源调度 # 运维 # Java # Spark

Echo_Wish

|

17天前

|

博文

|

来自：大数据与机器学习

Parquet 和 ORC 到底有啥区别？别再云里雾里了，咱今天把列式存储聊明白！

# SQL # 存储 # 分布式计算 # HIVE # Spark

Echo_Wish

|

20天前

|

博文

|

来自：大数据与机器学习

ETL vs ELT：到底谁更牛？别被名字骗了，这俩是两种世界观

# 存储 # 分布式计算 # 数据库 # C++ # Spark

Echo_Wish

|

23天前

|

博文

|

来自：大数据与机器学习

到底该选谁？Hadoop、Spark、Flink、云大数据的“江湖全景图”

# 分布式计算 # Hadoop # 大数据 # 流计算 # Spark

阿里云开发者

|

23天前

|

博文

手把手教你搞定大数据上云：数据迁移的全流程解析

本文深入探讨了企业数据迁移的核心价值与复杂挑战，重点分析了离线大数据平台在物理传输、系统耦合与数据校验三方面的难题。文章系统阐述了存储格式、表格式、计算引擎等关键技术原理，并结合LHM等工具介绍了自动化迁移的实践演进，展望了未来智能化、闭环化的数据流动方向。

# 存储 # SQL # 分布式计算 # MaxCompute # Spark

Echo_Wish

|

24天前

|

博文

|

来自：大数据与机器学习

从“攒一锅再算”到“来一条就干一条”：大数据批处理到流处理的进化之路

# 分布式计算 # 大数据 # Hadoop # 流计算 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark