分布式计算

首页 标签 分布式计算
# 分布式计算 #
关注
37851内容
别让数据平台“盲开车”:可观测性三件套(指标、日志、追踪)到底怎么落地?
别让数据平台“盲开车”:可观测性三件套(指标、日志、追踪)到底怎么落地?
Spark 批处理调优这点事:资源怎么要、Shuffle 怎么省、序列化怎么选?我用这些年踩过的坑告诉你
Spark 批处理调优这点事:资源怎么要、Shuffle 怎么省、序列化怎么选?我用这些年踩过的坑告诉你
|
16天前
|
Pandas处理大规模数据:分块读取与内存优化实战指南
本文揭秘Pandas处理大规模数据的实战技巧,从分块读取、内存优化到高效存储,结合真实案例教你如何在8GB内存环境下流畅处理50GB数据,彻底告别“MemoryError”。
Parquet 和 ORC 到底有啥区别?别再云里雾里了,咱今天把列式存储聊明白!
Parquet 和 ORC 到底有啥区别?别再云里雾里了,咱今天把列式存储聊明白!
ETL vs ELT:到底谁更牛?别被名字骗了,这俩是两种世界观
ETL vs ELT:到底谁更牛?别被名字骗了,这俩是两种世界观
|
23天前
|
手把手教你搞定大数据上云:数据迁移的全流程解析
本文深入探讨了企业数据迁移的核心价值与复杂挑战,重点分析了离线大数据平台在物理传输、系统耦合与数据校验三方面的难题。文章系统阐述了存储格式、表格式、计算引擎等关键技术原理,并结合LHM等工具介绍了自动化迁移的实践演进,展望了未来智能化、闭环化的数据流动方向。
免费试用