准备工作

本文涉及的产品
推荐全链路深度定制开发平台,高级版 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本文档介绍了阿里云智能推荐服务的使用流程,包括数据准备、行为埋点逻辑核对和数据上传方案。内容涉及不同行业的数据规范,如内容、电商和新闻行业,以及测试数据的获取。数据上传分为启动数据和实时数据两步,提供了全服务端SDK和友盟+服务端SDK等多种上传方案。此外,还介绍了通过历史数据启动实例的方法。建议用户根据自身行业和数据情况选择合适的方案。

概述

欢迎使用智能推荐,这里主要为您介绍如何快速熟悉产品,了解使用流程,快速找到帮助信息,以及如何让系统为您更好的服务。

该部分主要介绍搭建一个智能推荐服务所必须的一些准备工作,并对控制台的主要功能项进行初步了解。准备工作完成后,您需要选定适合自己的行业和场景模板,结合您当前的数据情况选择匹配的数据上报方式,在保证数据质量的前提下,进行推荐的测试与线上服务部署。

名词解释

  • 行为埋点逻辑:指的是采集到符合AIRec所需规范的用户行为数据,所需要符合的逻辑。AIRec推荐算法是需要用户的行为数据来学习用户喜好的。
  • 启动数据:指AIRec实例启动之前,准备好的已有的历史数据,该部分数据可以用于模型启动,让其更快的拥有推荐效果。
  • 实时数据:实例启动完成后,仅可以通过SDK上传的,增量的数据。------------------
  • DataWorks、MaxCompute:是阿里云基于云原生的另外两款大数据服务,可搭配AIRec使用。

一、根据数据规范准备数据

不同行业的数据规范存在差异,请按照您所属的行业进行文档阅读与数据准备。

如果想要先测试功能或接口,则可通过上传如下的测试数据。

测试数据

智能推荐服务提供了可以用来测试的数据,您可以从下面的链接中下载对应的数据。

下载链接:测试数据下载地址

二、核对行为埋点逻辑是否符合规范

智能推荐需要至少具备曝光、点击行为数据,并且曝光数据要大于点击数据。详细的内容请参考数据埋点指南

如您暂时无法提供曝光数据,可参考“常见问题”处的15、埋点逻辑暂时无法提供曝光或trace_info数据怎么办?

三、确认合适的数据上传方案

注意:此处的数据上传流程包括2步,分别是启动数据与实时数据推送。

2个步骤的数据上传均有多种方案,您可按照您当前的数据形态选择最适合的对接方案。实时数据推送的2种方式均需要您确认当数据发生变动时能够实时同步到智能推荐中。

您可以根据您的实际情况,在每一步流程中选择适合您的方案:

数据推送流程

可选方案

一、启动数据

1、无历史数据可用:

快速启动实例即可

2、有历史数据可用:

通过MaxCompute上传历史数据并启动

二、实时数据

1、使用全服务端SDK:

用户、物品、行为数据全部用服务端SDK推送、更新

2、服务端SDK+友盟SDK:

通过服务端SDK上传与更新用户、物品信息,通过友盟SDK推送行为数据

以下为各方案具体操作流程:

I 快速启动实例

1、全服务端SDK上传数据

通过全服务端SDK快速启动实例

方案概述:您需要全部通过服务端SDK的方式上报user、item以及behavior数据。

2、友盟上传行为数据+服务端上传item及user数据

通过友盟+服务端SDK快速启动实例

方案概述:user、item数据通过服务端SDK上报,behavior数据通过使用推荐定制的客户端SDK(即友盟SDK工具)首先进行埋点,埋点完成后,在控制台选配后将自动同步。

II 通过历史数据启动实例

通过历史数据启动实例

方案概述:您需要首先将user、item以及1-2周的behavior数据传到阿里云MaxCompute服务中(推荐使用DataWorks),数据导入成功后生效服务,并通过服务端SDK上报的方式同步user、item信息变更,上报实时产生的behavior数据。

四、使用友盟SDK(可选

相关实践学习
跟阿里云技术专家学习智能推荐系统
阿里云机器学习PAI团队推出,面向的是企业级的推荐业务应用——《企业级智能推荐系统介绍》,意在结合PAI团队服务各个推荐场景互联网客户的经验,给大家带来更多推荐业务相关的知识普及。PAI是阿里云的算法平台,面向各类客户提供高性能算法和计算框架,在阿里云上有上万企业和开发者客户,其中很大比例为营销推荐场景客户。本次课程分为5个小节:课程1:推荐系统基本概念及架构说明课程2:推荐系统召回算法级架构说明课程3:推荐系统排序算法级架构说明课程4:推荐系统线上服务编排课程5:实操10分钟实现一个简单的推荐系统     -------------------------------------------------------------------------   相关的阿里云产品:机器学习PAI 阿里云机器学习平台PAI(Platform of Artificial Intelligence),为传统机器学习和深度学习提供了从数据处理、模型训练、服务部署到预测的一站式服务。 了解产品详情: https://www.aliyun.com/product/bigdata/product/learn
目录
相关文章
|
11月前
|
Java 程序员
工作中遇到的点滴
工作中遇到的点滴
57 0
|
10月前
|
Cloud Native Linux Go
工作中你会使用到 grpcurl 吗?
工作中你会使用到 grpcurl 吗?
|
开发者
思考你的工作
为什么你明明每天工作很努力,但依然感觉自己的技术进步很慢?
58 0
|
IDE JavaScript 定位技术
2021年,工作发生了动荡.....
你能相信在过去的两年里,我们的工作方式发生了动荡吗? 开始的时候很艰难,但现在,2021年的结束就在眼前,我们已经习惯了远程办公、在线办公,并期望市场能赶上新常态。 对远程办公团队(尤其是开发团队)的创新和协作的要求,可能是我们目前可以观察到的行业中最强烈的趋势之一。
2021年,工作发生了动荡.....
|
前端开发
2020.07 G2 工作小结
? 修复的一些问题 修复 interval 下 shape='line' 设置 lineCap: 'round' 样式失效 Tip: 可用于进度条的绘制,相比于市面上现有的前端进度条组件,可以做到大小的自适应。 chart .interval() .position('const*value') .shape('line') .style({
如此之乱的思绪,如何才能专心工作?
      最近的思维特别的乱,乱得乱七八糟的。写一下也许能好一点点。 女朋友(难找哇) 谈恋爱(花钱呀) 见父母(不好过关呀) 买房子(没钱呀) 生小孩(养不起呀) 买奶粉(国内的有毒,国外的太贵) 欧洲弄一个告诉粒子流的对撞,不知道会装出个什么结果。
974 0
有效的工作,小记
    最近做的一个功能,一个静态页面上有很多需要翻译,需要替换的文本,由于网站上有翻译界面,只需做个关键词入库操作即可, 所以简单写了几句代码,代替人工操作。     1.通过http爬取网页html,然后正则匹配标签内的文本,添加到集合     2.遍历集合做入库操作                              循环插入的性能不好,应该用批量插入的做法,不过数据不多,就没整那么复杂了。
827 0
|
Web App开发 消息中间件 NoSQL
下一篇
无影云桌面