文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

实时样本拼接的架构是什么样的？

展开

收起

云上静思 2021-11-05 16:20:56 1754 版权

1 条回答

写回答

取消提交回答

开发者小助手_LS
实时样本拼接如图示。

实时用户行为会被采集并放进Flink里做样本拼接。这样样本拼接就包含了两个部分：
1. 首先需要知道这个样本是正样本还是负样本。判断正负样本的过程是，通过实时行为日志，如果用户展示流和点击流join，这就是一个正样本，反之就是负样本。
2. 除了区分正负样本，还要找到用户特征，特征是通过推理服务而来的，通过特征判断用户的感兴趣程度。这些特征会被放进Kafka里保存下来，然后再放进Flink中。
资料来源：《实时数仓“王炸组合”-实时计算 Flink 版+Hologre》链接：https://developer.aliyun.com/topic/download?id=7944
2021-11-05 22:29:56

赞同展开评论

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

购买阿里国外的云服务器是否可以访问谷歌？

90781

this xml file does not appear to have any style in

59269

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

278990

#支付宝授权提示请在支付宝客户端打开链接

21694

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

139849

配置https后网页打开出现ERR_SSL_VERSION_OR_CIPHER_MISMATCH错误

46262

yyyy-MM-dd'T'HH：mm：ss.SSSZZ和yyyy-MM-dd'T'HH：mm：ss.

46547

#支付宝周期扣款无线端唤起签约页面提示“免密支付安全验证”？

6675

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

63148

sql server的用户名和密码怎么查啊？

40320

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

Apache Flink Agents 0.2.1 发布公告

Flink CDC 3.6.0：支持 Flink 1.20/2.2, MySQL/PostgreSQL入湖入流支持Schema Evolution

相约深圳，全球征集｜Flink Forward Asia 2026 演讲议题征集正式启动

Flink Agents 0.3 Roadmap解读

Flink Forward Asia 2026 官宣深圳｜From Cloud Native to AI Native

实时样本拼接的架构是什么样的？

实时计算 Flink

相关文章

相关解决方案

热门讨论

热门文章