准备工作

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本文档介绍了阿里云智能推荐服务的使用流程,包括数据准备、行为埋点逻辑核对和数据上传方案。内容涉及不同行业的数据规范,如内容、电商和新闻行业,以及测试数据的获取。数据上传分为启动数据和实时数据两步,提供了全服务端SDK和友盟+服务端SDK等多种上传方案。此外,还介绍了通过历史数据启动实例的方法。建议用户根据自身行业和数据情况选择合适的方案。

概述

欢迎使用智能推荐,这里主要为您介绍如何快速熟悉产品,了解使用流程,快速找到帮助信息,以及如何让系统为您更好的服务。

该部分主要介绍搭建一个智能推荐服务所必须的一些准备工作,并对控制台的主要功能项进行初步了解。准备工作完成后,您需要选定适合自己的行业和场景模板,结合您当前的数据情况选择匹配的数据上报方式,在保证数据质量的前提下,进行推荐的测试与线上服务部署。

名词解释

  • 行为埋点逻辑:指的是采集到符合AIRec所需规范的用户行为数据,所需要符合的逻辑。AIRec推荐算法是需要用户的行为数据来学习用户喜好的。
  • 启动数据:指AIRec实例启动之前,准备好的已有的历史数据,该部分数据可以用于模型启动,让其更快的拥有推荐效果。
  • 实时数据:实例启动完成后,仅可以通过SDK上传的,增量的数据。------------------
  • DataWorks、MaxCompute:是阿里云基于云原生的另外两款大数据服务,可搭配AIRec使用。

一、根据数据规范准备数据

不同行业的数据规范存在差异,请按照您所属的行业进行文档阅读与数据准备。

如果想要先测试功能或接口,则可通过上传如下的测试数据。

测试数据

智能推荐服务提供了可以用来测试的数据,您可以从下面的链接中下载对应的数据。

下载链接:测试数据下载地址

二、核对行为埋点逻辑是否符合规范

智能推荐需要至少具备曝光、点击行为数据,并且曝光数据要大于点击数据。详细的内容请参考数据埋点指南

如您暂时无法提供曝光数据,可参考“常见问题”处的15、埋点逻辑暂时无法提供曝光或trace_info数据怎么办?

三、确认合适的数据上传方案

注意:此处的数据上传流程包括2步,分别是启动数据与实时数据推送。

2个步骤的数据上传均有多种方案,您可按照您当前的数据形态选择最适合的对接方案。实时数据推送的2种方式均需要您确认当数据发生变动时能够实时同步到智能推荐中。

您可以根据您的实际情况,在每一步流程中选择适合您的方案:

数据推送流程

可选方案

一、启动数据

1、无历史数据可用:

快速启动实例即可

2、有历史数据可用:

通过MaxCompute上传历史数据并启动

二、实时数据

1、使用全服务端SDK:

用户、物品、行为数据全部用服务端SDK推送、更新

2、服务端SDK+友盟SDK:

通过服务端SDK上传与更新用户、物品信息,通过友盟SDK推送行为数据

以下为各方案具体操作流程:

I 快速启动实例

1、全服务端SDK上传数据

通过全服务端SDK快速启动实例

方案概述:您需要全部通过服务端SDK的方式上报user、item以及behavior数据。

2、友盟上传行为数据+服务端上传item及user数据

通过友盟+服务端SDK快速启动实例

方案概述:user、item数据通过服务端SDK上报,behavior数据通过使用推荐定制的客户端SDK(即友盟SDK工具)首先进行埋点,埋点完成后,在控制台选配后将自动同步。

II 通过历史数据启动实例

通过历史数据启动实例

方案概述:您需要首先将user、item以及1-2周的behavior数据传到阿里云MaxCompute服务中(推荐使用DataWorks),数据导入成功后生效服务,并通过服务端SDK上报的方式同步user、item信息变更,上报实时产生的behavior数据。

四、使用友盟SDK(可选

相关实践学习
跟阿里云技术专家学习智能推荐系统
阿里云机器学习PAI团队推出,面向的是企业级的推荐业务应用——《企业级智能推荐系统介绍》,意在结合PAI团队服务各个推荐场景互联网客户的经验,给大家带来更多推荐业务相关的知识普及。PAI是阿里云的算法平台,面向各类客户提供高性能算法和计算框架,在阿里云上有上万企业和开发者客户,其中很大比例为营销推荐场景客户。本次课程分为5个小节:课程1:推荐系统基本概念及架构说明课程2:推荐系统召回算法级架构说明课程3:推荐系统排序算法级架构说明课程4:推荐系统线上服务编排课程5:实操10分钟实现一个简单的推荐系统     -------------------------------------------------------------------------   相关的阿里云产品:机器学习PAI 阿里云机器学习平台PAI(Platform of Artificial Intelligence),为传统机器学习和深度学习提供了从数据处理、模型训练、服务部署到预测的一站式服务。 了解产品详情: https://www.aliyun.com/product/bigdata/product/learn
目录
相关文章
|
存储 Java 关系型数据库
java8新特性之--强大的Stream API详细讲解
java8新特性之--强大的Stream API详细讲解
144 0
|
前端开发 JavaScript
一篇文章搞懂前端事件监听
一篇文章搞懂前端事件监听
418 0
|
移动开发 运维 监控
移动化置地:移动开发平台EMAS内外兼修,助力流量聚合与效能变革
随着移动互联网的发展以及5G时代的到来,移动化数字化已经是各行业信息化建设的发展趋势。提升业务移动覆盖度,移动化是推动企业业务数字化的关键路径。华润置地“十三五”信息化规划,移动应用是重点建设内容之一。华润置地智能与信息化部积极推进移动化转型创新,与阿里云强强联合共建移动开发平台,旨在快速完成业务移动化的转型升级目标,助力业务开展和业绩达成。
移动化置地:移动开发平台EMAS内外兼修,助力流量聚合与效能变革
|
JavaScript 前端开发
《你不知道的JavaScript》 (中) 阅读摘要
本书属于基础类书籍,会有比较多的基础知识,所以这里仅记录平常不怎么容易注意到的知识点,不会全记,供大家和自己翻阅; 上中下三本的读书笔记: 《你不知道的JavaScript》 (上) 读书笔记 《你不知道的JavaScript》 (中) 读书笔记 《你不知道的JavaScript》 (下) 读书笔记 如果希望获取本书的 PDF 资源,可以关注文末二维码加微信群找群主要~
SpringBoot_05_热部署和debug
一、pom.xml配置 增加以下pom.xml配置 org.springframework.boot spring-boot-maven-plugin ...
1195 0
|
8天前
|
数据采集 自然语言处理 搜索推荐
基于Qwen3的Embedding和Rerank模型系列,开源!
近年来,随着大规模预训练语言模型(LLM)的飞速发展,文本嵌入(Embedding)和重排序(Reranking)技术在搜索引擎、问答系统、推荐系统等多个领域的重要性愈发凸显。
942 81
|
7天前
|
安全 JavaScript 前端开发
Typora免费下载,不需要激活,Typora早期版本,Markdown编辑器
Typora是一款支持实时预览的Markdown编辑器,跨平台兼容Windows、macOS和Linux,适合写作、笔记和技术文档。本文提供合法安全的Typora早期免费版安装方案及常见问题解决方法,助你快速上手。同时详细介绍了Markdown基础用法,包括标题、加粗、斜体、列表、链接、图片、引用、代码块和表格等常用语法,帮助用户高效编写结构化内容。
975 19