阿里云云原生

2024-05-15

流水线 YAML 高级用法来了，大幅降低重复代码、灵活编排多任务

云效 Flow 流水线 YAML 引入了 template 语法，支持使用模板语言来动态渲染流水线 YAML，满足多个相同或类似逻辑的 Job 批量配置场景，满足多 Job 按需动态生成场景，帮助降低流水线 YAML 重复代码，灵活编排多任务。

阿里云云原生

70,512

杳天

2022-12-13

1919

技术原理，Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

杳天

1,919

瑞丹

2023-11-09

424

Dataphin实时研发实践—电商场景下的实时数据大屏构建

实时数据大屏是实时计算的重要应用场景之一，广泛应用在电商业务中，用于实时监控和分析电商平台的运营情况。通过大屏展示实时的销售额、订单量、用户活跃度、商品热度等数据指标，帮助业务人员随时了解业务的实时状态，快速发现问题和机会。同时，通过数据可视化和趋势分析，大屏也提供了决策支持和优化运营的功能，帮助业务人员做出及时的决策和调整策略，优化电商业务的运营效果。下面以电商业务为背景，介绍如何构建经典实时数仓，实现实时数据从业务库到ODS层、DWD层、DWS层全链路流转，基于Dataphin和Quick BI实现实时数据大屏。

瑞丹

424

阿里云瑶池数据库

2024-08-13

96

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

AnalyticDB Spark如何通过向量化引擎提升性能？

阿里云瑶池数据库

96

昕羽

2024-05-15

65180

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

Apache Paimon 和 Apache Hudi 作为数据湖存储格式，有着高吞吐的写入和低延迟的查询性能，是构建数据湖的常用组件。本文在阿里云EMR上，针对数据实时入湖场景，对 Paimon 和 Hudi 的性能进行比对，并分别以 Paimon 和 Hudi 作为统一存储搭建准实时数仓。

昕羽

65,180

陈宗志

2024-05-15

155

长路漫漫, 从Blink-tree 到Bw-tree （上）

在前面的文章路在脚下, 从BTree 到Polar Index中提到, 我们已经将InnoDB 里面Btree 替换成Blink Tree, 高并发压力下, 在标准的TPCC 场景中最高能够有239%的性能提升, 然后我们对InnoDB 的file space模块也进行了优化, 在分配新pag...

陈宗志

155

梦实

2024-05-15

84214

PolarDB-X最佳实践：如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法（CO_HASH），实现高效的多维度查询。

梦实

84,214

雅纯

2024-05-15

121546

云效AppStack+阿里云MSE实现应用服务全链路灰度

在应用开发测试验证通过后、进行生产发布前，为了降低新版本发布带来的风险，期望能够先部署到灰度环境，用小部分业务流量进行全链路灰度验证，验证通过后再全量发布生产。本文主要介绍如何通过阿里云MSE 微服务引擎和云效应用交付平台AppStack 实现灰度发布。

雅纯

121,546

瑞丹

2024-05-15

149

跨节点参数的缘起与今生

Dataphin v3.13引入了跨节点参数功能，允许任务间传递消息。输出节点（如SQL、Shell、Python任务）能输出参数，输入节点可以接收并使用这些参数。此功能解决了通过公共存储中转消息的复杂性和低效问题。应用场景包括：金融企业的币种转换，其中汇率任务（输出节点）提供汇率，转换任务（输入节点）使用该汇率；以及产品目录更新检查，通过跨节点参数控制是否需要执行数据导入任务。用户可以通过任务编辑器设置和传递跨节点参数，并在运维中进行补数据操作。

瑞丹

149

类目筛选

内容类型

流水线 YAML 高级用法来了，大幅降低重复代码、灵活编排多任务

技术原理，Hologres Binlog技术原理揭秘

Dataphin实时研发实践—电商场景下的实时数据大屏构建

7倍性能提升｜阿里云AnalyticDB Spark向量化能力解析

阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse

长路漫漫, 从Blink-tree 到Bw-tree （上）

PolarDB-X最佳实践：如何设计一张订单表

云效AppStack+阿里云MSE实现应用服务全链路灰度

跨节点参数的缘起与今生