文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

要实现实时推荐系统架构，会用到一些什么样的系统？

要实现实时推荐系统架构，会用到一些什么样的系统？

展开

收起

云上静思 2021-11-05 16:20:00 849 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

开发者小助手_LS

如图所示，消息队列用的是 Kafka，离线的存储假设用的是 HDFS。不管是实时特征计算还是离线特征计算，现在都可以用 Flink 来进行计算，利用 Flink 流批一体的能力，能够保证实时和离线的特征计算所产生的结果是一致的。

Hologres 在这里的作用是特征存储，Hologres 特征存储的好处是可以提供非常高效的点查，另一个就是在做实时特征计算的时候，经常会产生一些不准确的特征，需要在后期对这些特征进行一些修正。可以通过 Flink 加 Hologres 的机制进行很好的特征的修正。

在推理服务这一侧，通过保留用来做推理的特征，放到后面的样本拼接里面,这里的消息队列也会使用 Kafka。样本拼接这个事情会用 Flink 来做，Flink 一个非常经典的应用场景做双流 Join。把样本给拼接出来后，在把特征给加上，接着把算好的样本同样也放进 Hologres。

在样本存储的情况下，Hologres 里面的样本既可以拿来做实时的模型训练，通过读取Hologres 的 Binlog 来做实时的模型训练，也可以通过 Hologres 批量的 Scan 去做离线的模型训练。

不管是在线还是离线的模型训练，都可以用 Flink 或者是 FlinkML，也就是 Alink 来做。如果是传统机器学习的话，也可以用 TensorFlow 来做深度学习的模型训练，这样的模型还是可能会存到 HDFS，然后通过 Flink 和 TensorFlow 做模型的验证，最后做线上的推理服务。

线上推理服务很多用户会有自己的推理引擎，如果有可以用，如果想用 Flink 和TensorFlow 的话也可以直接使用.

资料来源：《实时数仓“王炸组合”-实时计算 Flink 版+Hologre》链接：https://developer.aliyun.com/topic/download?id=7944

2021-11-05 22:45:53

赞同展开评论

问答分类：

搜索推荐实时计算 Flink版

问答标签：

推荐系统架构架构系统推荐系统系统

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

随着工单系统商业化的推进，微服务架构会带来什么问题？

147

1

0

推荐系统的架构有没有什么流程图？

244

1

0

公司上云，如何系统评估现有IDC的架构复杂度？阿里云提供自动化评估工具？

134

0

0

PolarDB-X arm架构+龙蜥系统离线镜像包已经导入了私有镜像仓库安装失败环境镜像是否有问题？

318

1

0

blade支持ARM架构的系统吗？

288

1

0

企业级应用系统体系架构中的Hadoop，Strom和Spark之间有什么关系吗？

1076

1

0

企业级应用系统体系架构中每个服务之间是直接交互的吗？

870

1

0

微服务架构是怎样提升开发效率和系统整体的稳定性的？

1128

1

0

随着业务从单体架构向分布式架构演进以及部署形式的变化，服务之间的依赖关系变得越来越复杂，业务系统也面

897

1

0

传统架构中各个业务模块耦合严重，系统整体响应时间长，系统开发效率低，可以怎么解决这一痛点呢？

960

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

GEO优化中的SoA指标：定义及其优化指导意义

获客逻辑彻底变了：从SEO到GEO，企业该怎么做？

GEO投资回报率计算模型：基于三层收益拆解与成本归因框架及实证验证

外贸阀门站AI搜索复盘：从行业页到证据链

相关解决方案

更多

云上高可用架构

高效实现前后端分离架构升级

构建视频直播系统

LightRAG：轻量级知识图谱RAG系统

极速构建实时全文检索系统

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink cdc sqlserver 希望不同步某些数据行

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC底层监听是不是用到flink定时任务还是啥？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

flinkcdc在IDEA运行正常，打包就报错

展开全部

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

流计算精品翻译: The Dataflow Model

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

使用 Kafka 和 Flink 构建实时数据处理系统

Flink: 实时规则引擎助力新零售发展

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

携程实时智能检测平台建设实践

展开全部

还有其他疑问?