昕羽

2024-05-15

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

昕羽

65,153

韩述

2023-09-13

2030

AnalyticDB PostgreSQL构建一站式实时数仓实践

本文介绍通过 AnalyticDB PostgreSQL 版基于实时物化视图，构建流批一体的一站式实时数仓解决方案，实现一套系统、一份数据、一次写入，即可在数仓内完成实时数据源头导入到实时分析全流程。

韩述

2,030

刘佳旭

2023-09-26

138059

云原生场景下高可用架构的最佳实践

刘佳旭

138,059

霖玉

2023-06-15

13300

大数据SQL数据倾斜与数据膨胀的优化与经验总结

目前市面上大数据查询分析引擎层出不穷，但在业务使用过程中，大多含有性能瓶颈的SQL，主要集中在数据倾斜与数据膨胀问题中。本文结合业界对大数据SQL的使用与优化，尝试给出相对系统性的解决方案。

霖玉

13,300

喻奎

2023-06-25

10073

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,073

石樵

2023-12-01

1315

分布式锁实现原理与最佳实践

在单体的应用开发场景中涉及并发同步时，大家往往采用Synchronized（同步）或同一个JVM内Lock机制来解决多线程间的同步问题。而在分布式集群工作的开发场景中，就需要一种更加高级的锁机制来处理跨机器的进程之间的数据同步问题，这种跨机器的锁就是分布式锁。接下来本文将为大家分享分布式锁的最佳实践。

石樵

1,315

桦雄

2024-05-15

61432

走进RDS之MySQL内存分配与管理（中）

MySQL内存分配与管理总体上分为上中下三篇介绍，本篇为中篇，主要介绍 InnoDB 的内存构成和使用，代码版本主要基于8.0.25。

桦雄

61,432

梦实

2024-05-15

84188

PolarDB-X最佳实践：如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法（CO_HASH），实现高效的多维度查询。

梦实

84,188

ModelScope

2024-05-15

108859

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,859

类目筛选

内容类型

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

AnalyticDB PostgreSQL构建一站式实时数仓实践

云原生场景下高可用架构的最佳实践

大数据SQL数据倾斜与数据膨胀的优化与经验总结

MaxCompute湖仓一体近实时增量处理技术架构揭秘

分布式锁实现原理与最佳实践

走进RDS之MySQL内存分配与管理（中）

PolarDB-X最佳实践：如何设计一张订单表

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践