开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

如何做到离线特征回填?

如何做到离线特征回填?

展开
收起
云上静思 2021-11-05 16:23:12 920 0
1 条回答
写回答
取消 提交回答
  • 如图示,离线特征回填一般分为两步:

    1. 第一步,在实时系统里先把新的特征给加上,那么从某个时刻开始,Hologres里面存储生成的特征就都是新的特征了;

    2. 第二步,对应那些历史数据,重新做一个特征回填,用HDFS里面存在的历史行为数据跑一个批量任务,然后把历史上的一些给补上。

    配图15.png

    资料来源:《实时数仓“王炸组合”-实时计算 Flink 版+Hologre》链接:https://developer.aliyun.com/topic/download?id=7944

    2021-11-05 22:28:07
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
百度大规模时序指标自动异常检测实战 立即下载
千亿特征流式学习在大规模推荐排序场景的应用 立即下载
千亿特征流式学习 在大规模推荐排序场景的应用 立即下载