如何做到离线特征回填?

如何做到离线特征回填?

展开
收起
云上静思 2021-11-05 16:23:12 978 分享 版权
1 条回答
写回答
取消 提交回答
  • 如图示,离线特征回填一般分为两步:

    1. 第一步,在实时系统里先把新的特征给加上,那么从某个时刻开始,Hologres里面存储生成的特征就都是新的特征了;

    2. 第二步,对应那些历史数据,重新做一个特征回填,用HDFS里面存在的历史行为数据跑一个批量任务,然后把历史上的一些给补上。

    配图15.png

    资料来源:《实时数仓“王炸组合”-实时计算 Flink 版+Hologre》链接:https://developer.aliyun.com/topic/download?id=7944

    2021-11-05 22:28:07
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

收录在圈子:
实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。
还有其他疑问?
咨询AI助理