1.实时数仓、Data Pipeline
接kafka实时消息数据关联维表信息(离线表)进行字段补全,输出新的topic到kafka
pv、cl、od等实时数据消息接入kafka,进行消费
补齐数据的处理逻辑:离线hive表数据推送到hbase+redis,实时处理的时候去关联,如果查不到调线上接口查询,可以避免所有查询调用线上接口,减少接口压力。
离线数仓分层方案:
2.实时数据打标----商品上线
3.数据分析
1.实时数仓、Data Pipeline
接kafka实时消息数据关联维表信息(离线表)进行字段补全,输出新的topic到kafka
pv、cl、od等实时数据消息接入kafka,进行消费
补齐数据的处理逻辑:离线hive表数据推送到hbase+redis,实时处理的时候去关联,如果查不到调线上接口查询,可以避免所有查询调用线上接口,减少接口压力。
离线数仓分层方案:
2.实时数据打标----商品上线
3.数据分析