Hologres Dynamic Table在淘天价格力的业务实践

简介: 淘天价格力团队依托Hologres Dynamic Table,实现亿级商品数据的高效治理。通过增量刷新与全量刷新机制,支持秒级圈选、分钟级报表更新,满足大促场景下高时效、多维度分析需求,显著提升数据灵活性与决策效率。

业务介绍

淘天价格力团队作为平台价格治理的核心部门,承载着淘宝天猫全域商品价格管理的重要职责。团队掌握着淘内外所有商品的全量价格信息,包括商品原价、券后价等多维度价格数据,每日增量数据规模达亿级以上。

在电商大促上下线时(如618、双11),价格变动频率会呈现数倍增长,这些海量数据不仅体量大,而且具有高时效性、强关联性和复杂变化特征。在大促常态化的现状下,行业运营急需高时效性的数据看板以便及时发现问题,并且需要商品维度、店铺维度等多维圈选能力,及时圈选出符合要求的数据并进行处理或分析。Hologres Dynamic Table完美契合业务需求。

Hologres Dynamic Table介绍

视图是基于表的虚拟表,不存储数据只存储查询逻辑,每次访问时动态执行SQL,返回最新结果,主要帮助我们简化复杂查询。如果没有视图,那么对于以下查询,需要我们自己保存到一个地方,查询时执行完整SQL。

SELECT region, SUM(amount) as total_sales 
FROM orders 
WHERE status = 'completed';

如果有视图,我们可以把查询托管给视图,直接查询视图,可以简化使用。

-- 创建视图
CREATE VIEW sales_summary AS 
SELECT region, SUM(amount) as total_sales 
FROM orders 
WHERE status = 'completed';
-- 查询视图
SELECT * FROM sales_summary;

视图虽然帮我们管理了SQL的定义,但是复杂逻辑SQL的执行通常很耗费时间。将视图的查询结果实际保存下来就是物化视图。物化视图的结果需要定期更新以保证数据新鲜度。所以物化视图就是预定义SQL + 物化结果 + 周期更新

Hologres Dynamic Table与物化视图类似,架构如下,提供全量刷新与增量刷新两种刷新模式。

全量刷新就是在周期到来时进行一次全量刷新覆盖,相当于Insert Overwrite。

增量刷新每次只处理增量数据,原理为在底层创建一个列存state表,存储中间状态(类似Flink state)。增量数据先以微批次方式做内存态聚合,再与state表合并,最后提交时以BulkLoad写入动态表。

在 Hologres V3.1 Dynamic Table 的能力如下。

备注

提供auto模式,若Query支持增量刷新则优先选择增量刷新,否则退化为全量刷新

文档

声明式数据处理自动数据流转-Dynamic Table-实时数仓 Hologres-阿里云

刷新模式

增量刷新

全量刷新

技术实现

微批次增量处理

INSERT OVERWRITE

刷新触发

定时/手动

最小可配置间隔

1分钟

增量机制

Binlog:处理CDC数据

Stream:文件级别处理增量数据,读取性能比Binlog高。

无(全量)

基表类型

内表、动态表、Paimon外表

内表、动态表、Paimon外表、ODPS外表、DLF外表

Join支持

✅ 完整Join支持

聚合函数

✅ 支持

索引配置

✅ 支持

窗口函数

❌ 不支持

✅ 支持

IN子查询

❌ 不支持

✅ 支持

查询改写

❌ 不支持

分区支持

✅ 物理/逻辑分区

分区刷新

配置范围

历史分区回刷

✅ 手动回刷

计算资源

Local/Serverless

Serverless是实例资源上额外的资源,最大4096core,可为动态表设置可用core。

资源隔离

实例资源/Serverless隔离

Query变更:新增列、修改计算逻辑

✅ 支持

主要限制


  • Stream模式基表只能是列存表
  • 若上游表为分区表,无法同时消费上游表的多个分区
  • 仅支持把刷新模式从增量改为全量,不支持从全量改为增量

• 资源消耗大

业务实践

数据圈选

业务背景

价格力团队需要为多个业务场景如商品价格回滚、全网比价等提供灵活的数据圈选能力,要求支持动态的指标组合和筛选条件配置。圈选集创建后,圈选结果也需要随底表数据的变化而变动,不同业务场景可接受的数据变化时间间隔也有所不同。

解决方案

Dynamic Table完美符合场景要求:工程基于不同的筛选规则翻译成相应的DQL,并根据业务场景的需求灵活设置数据新鲜度等配置参数,最终生成完整的Dynamic Table DDL。

指标系统: 指标系统中将表列配置为实体指标。业务指标提供高阶能力如级联指标、聚合、召回计算。

筛选组件: 提供通用筛选配置组件,根据业务场景展示相应指标

业务场景默认配置:Diamond中保存不同业务场景默认配置,包括刷新周期、刷新模式、默认召回条件、默认Join条件等

DDL生成: 将筛选条件与默认条件通过DSL翻译为Hologres Dynamic Table DDL

状态监控: 实现刷新状态检查机制,定期检查动态表刷新状态,区分未完成刷新刷新后无数据两种情况

数据供给:动态表第一次刷新完成后,提供Flink分页查询两种数据供给方式。若选择Flink,在动态表创建完成后会自动根据默认条件创建Flink任务,通常把数据变更作为消息发送给MetaQ

 1.jpg 

应用效果

该方案可在秒级亿级数据基表中完成Dynamic Table创建及初次数据刷新,已在价格力团队多个业务场景中部署应用,显著提升了数据圈选的灵活性和效率。



近实时报表构建

业务背景

数据看板的时效性越高,越能帮助运营及时发现问题,快速进行决策和业务调整。价格力团队内部分场景的报表数据原通过ODPS离线调度实现更新,但运营期望能有近实时分钟级数据

解决方案

数据分层构建: 基于Hologres Dynamic Table实现ODS → DWD → DWS → ADS数据架构的近实时化改造

增量刷新策略: 采用动态表增量刷新机制,设置分钟级刷新间隔,实现近实时数据更新,并分钟级保存历史数据

资源隔离保障: 通过使用Hologres Serverless资源减少与其他任务的资源竞争

2.png

应用效果

应用效果: 成功解决了数据看板的时效性痛点,亿级底表数据,输入RPS 1W处理时延从小时级降低至分钟级,可以灵活比对任意分钟数据的同比,双十一期间为运营团队提供了及时可靠的数据支撑。

想深入交流 Hologres 动态表的技术细节或落地场景?

欢迎加入 Hologres 技术交流群,与产品、架构、解决方案专家直接对话!

(扫码入群 👇)

立即免费试用 Hologres

无需预付费用,按实际查询量付费,新用户还可享免费额度!

(新用户描述扫码领取 👇)

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
2月前
|
存储 SQL 运维
Hologres Dynamic Table:高效增量刷新,构建实时统一数仓的核心利器
在实时数据架构中,Hologres Dynamic Table 基于有状态增量计算模型,有效解决“海量历史+少量新增”场景下的数据刷新难题。相比传统全量刷新,其通过持久化中间状态,实现复杂查询下的高效增量更新,显著降低延迟与资源消耗,提升实时数仓性能与运维效率。
|
2月前
|
存储 人工智能 运维
向量数据库实战指南:从部署到RAG落地
本文以轻量开源向量数据库Chroma为例,手把手带你完成环境部署、数据导入、相似性检索到RAG集成的全流程实战,避开新手常见坑,适配码农与大数据爱好者快速落地AI应用,助力掌握向量数据库核心技能。
|
存储 SQL 人工智能
Hologres 4.0全新发布:AI时代的一站式多模态分析平台
2025年云栖大会,Hologres发布全新4.0版本升级,以“AI时代的一站式多模态分析平台”为核心理念,全面展示了Hologres在结构化、半结构化与非结构化数据分析能力上的重大突破,特别是在OLAP分析、点查、向量检索、全文检索、湖仓协同及AI Function集成等方面的领先优势,刷新ClickBench、JSONBench、VectorDBBench等多项榜单,登顶第一。
|
5月前
|
存储 人工智能 大数据
云栖2025|阿里云开源大数据发布新一代“湖流一体”数智平台及全栈技术升级
阿里云在云栖大会发布“湖流一体”数智平台,推出DLF-3.0全模态湖仓、实时计算Flink版升级及EMR系列新品,融合实时化、多模态、智能化技术,打造AI时代高效开放的数据底座,赋能企业数字化转型。
1046 0
|
2月前
|
存储 人工智能 Serverless
AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中
2026年AI进入应用爆发期,但非结构化数据成为瓶颈。Hologres推出AI原生新架构HSAP 2.0,融合语义搜索、多维分析与Serverless弹性,打造统一数据平面,让企业海量数据高效赋能AI,破解“数据熵”难题,支撑智能客服、销售助手等复杂场景,实现从“为人服务”到“为AI服务”的跨越。
|
2月前
|
SQL 自然语言处理 数据挖掘
2026年BI行业深度盘点:Chat BI 从“被动看数”到“主动问数”的范式重构
2026年,传统BI遭遇瓶颈,企业亟需突破操作门槛、分析深度与数据孤岛三大痛点。对话式智能BI应运而生,以自然语言交互、深度语义理解与主动决策建议为核心,重塑数据分析范式。Quick BI 智能小Q 凭借“NL2SQL大模型+企业级数据引擎”双轮驱动,实现96.5%复杂SQL生成准确率,支持多源数据连接、垂直场景增强与企业级安全管控,真正让业务人员“开口问数”,获得可执行洞察,推动“人人都是分析师”的时代到来。
|
2月前
|
机器学习/深度学习 人工智能 编解码
当AI面对“说不清”的需求:如何实现更优解?
通义DeepResearch联合高德推出ArenaRL,首创基于相对比较的强化学习框架,破解开放域任务“无标准答案”难题。通过构建智能体竞技场,以线性复杂度实现高质量策略持续进化,已在出行规划、深度检索等复杂场景落地,并开源全流程工具与评测基准。
105 2
当AI面对“说不清”的需求:如何实现更优解?
|
11月前
|
存储 消息中间件 分布式计算
Hologres实时数仓在B站游戏的建设与实践
本文介绍了B站游戏业务中实时数据仓库的构建与优化过程。为满足日益增长的数据实时性需求,采用了Hologres作为核心组件优化传统Lambda架构,实现了存储层面的流批一体化及离线-实时数据的无缝衔接。文章详细描述了架构选型、分层设计(ODS、DWD、DIM、ADS)及关键技术挑战的解决方法,如高QPS点查、数据乱序重写等。目前,该实时数仓已广泛应用于运营分析、广告投放等多个场景,并计划进一步完善实时指标体系、扩展明细层应用及研发数据实时解析能力。
Hologres实时数仓在B站游戏的建设与实践
|
8月前
|
分布式计算 Serverless OLAP
实时数仓Hologres V3.1版本发布,Serverless型实例从零开始构建OLAP系统
Hologres推出Serverless型实例,支持按需计费、无需独享资源,适合新业务探索分析。高性能查询内表及MaxCompute/OSS外表,弹性扩展至512CU,性能媲美主流开源产品。新增Dynamic Table升级、直读架构优化及ChatBI解决方案,助力高效数据分析。
实时数仓Hologres V3.1版本发布,Serverless型实例从零开始构建OLAP系统
|
12月前
|
存储 SQL 监控
Hologres Dynamic Table快速入门
本文由Hologres PD赵红梅分享,主题为Dynamic Table快速入门。内容分为三部分:一是介绍Dynamic Table,包括其在实时数仓中的应用场景及技术实现;二是讲解Dynamic Table的使用方法与实操,涵盖全量、增量及混合刷新模式的创建与操作;三是提供使用建议,如选择刷新模式、监控延迟、分区表应用及计算资源分配等。此外,还对比了Dynamic Table与其他产品(如DIS异步物化视图和Snowflake Dynamic Tables)的功能差异,并推荐下载Hologres 3.0实践手册以深入了解一体化实时湖仓平台的最新功能。

热门文章

最新文章