2024-05-15
65065

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式,有着高吞吐的写入和低延迟的查询性能,是构建数据湖的常用组件。本文在阿里云EMR上,针对数据实时入湖场景,对 Paimon 和 Hudi 的性能进行比对,并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

65,065
2024-05-15
48166

走进RDS之MySQL内存分配与管理(下)

本篇为下篇,主要对MySQL内存限制特性进行解读,代码基于8.0.28。本文将围绕该项工作的改动、设计实现等方面展开介绍。

48,166
2024-05-15
2344

阿里云大降价后,再谈“降本增效”

2024年2月29日,阿里云宣布史上最大力度降价,引发行业对用云成本的热议。

2024-05-15
103

PolarDB 开源版 使用PostGIS 数据寻龙点穴(空间聚集分析)- 大数据与GIS分析解决线下店铺选址问题

背景PolarDB 的云原生存算分离架构, 具备低廉的数据存储、高效扩展弹性、高速多机并行计算能力、高速数据搜索和处理; PolarDB与计算算法结合, 将实现双剑合璧, 推动业务数据的价值产出, 将数据变成生产力.本文将介绍PolarDB 开源版 使用PostGIS 数据寻龙点穴(空间聚集分析)-...

103
2023-02-21
564

如何在Anolis OS上轻松使用 Kata 安全容器

本篇文章我们将详细介绍怎么轻松在 Anolis OS 上使用 Kata Containers 安全容器

564
4421

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

2024-05-15
459

基于AnalyticDB PostgreSQL的实时物化视图研发实践

AnalyticDB PostgreSQL企业数据智能平台是构建数据智能的全流程平台,提供可视化实时任务开发 + 实时数据洞察,让您轻松平移离线任务,使用SQL和简单配置即可完成整个实时数仓的搭建。

459
2024-05-15
116

跨节点参数的缘起与今生

Dataphin v3.13引入了跨节点参数功能,允许任务间传递消息。输出节点(如SQL、Shell、Python任务)能输出参数,输入节点可以接收并使用这些参数。此功能解决了通过公共存储中转消息的复杂性和低效问题。应用场景包括:金融企业的币种转换,其中汇率任务(输出节点)提供汇率,转换任务(输入节点)使用该汇率;以及产品目录更新检查,通过跨节点参数控制是否需要执行数据导入任务。用户可以通过任务编辑器设置和传递跨节点参数,并在运维中进行补数据操作。

116
2023-08-03
13097

搭建Hadoop环境

本教程介绍如何在Linux操作系统的ECS实例上快速搭建Hadoop伪分布式环境。

1
...
6
7
8
...
16
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
7/16