新手入门赛-阿里移动推荐算法(下)|学习笔记

简介: 快速学习新手入门赛-阿里移动推荐算法(下)

开发者学堂课程【天池大赛算法教程及获奖选手答辩 新手入门赛-阿里移动推荐算法(下)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/389/detail/5000


新手入门赛-阿里移动推荐算法(下)


内容介绍:

一、机器学习如何解决二分类问题
如何将购买预测的问题转化为二分类问题
线下如何实现

 

一、机器学习如何解决二分类问题

image.png

在命题中,给定一个二维平面,给出很多个点,这些点有两种不同的属性,有些是蓝色,有些是红色点。

问在给定一个新的点之后,需要判断它有多大可能是蓝色的,或有多大可能是红色,这就是一个最为基础的一个预测二分类的一个命题。

在这个命题中,解剖一下可以发现有三个关键组件,第一是研究对象即为平面上的点,这些对象拥有一些自己的特征,在这个问题中对应着这个点的坐标数值。

同时对象也拥有它的一个标签,蓝色或者红色,通常把它记为0或者1。那么传统的一个方法,逻辑斯回归就是用于解决此类问题。

通常将对象属于0或1的概率建模成一个表达式.

研究对象:点
对象特征:点坐标数值(X0,X1)
对象标签:蓝色(0)或者红色(1)
Logistic Rcgrcssion

建模:

image.png

目标:

image.png

二、如何将购买预测的问题转化为二分类问题

如何将购买预测的问题转化为二分类问题?

首先,给定0到30天的用户行为数据,然后预测31天的购买行为。并继续做一个简单的推广。

在原有的一个基础问题的概念之上,发现在这个问题中,点变成了一个三元组,这三组分别是特定的用户、特定的商品以及特定的考察日。是非常简单的坐标数据特征,然后可以上升为在考察日之前。

在多天的时间里面,该用户和该商品之间各种相关的,行为的一些统计量都可以作为特征,具体哪些统计可以通过思考这些业务的逻辑,去自自行构造。

给定0~30天的用户行为数据,预测31天的用户购买行为。
研究对象转化为 (用户商品考察日)
对象特征点坐标数值(X0,X1)转化为 在考察日之前该用户、该商品相关的各种行为的统计量
对象标签蓝色(0)或者红色(1) 转化为该用户在考察日购买了该商品(1)或者没购买该商品(0)

例(13245,7789,29)

X0:考察日前一天该用户对该商品进行了多少次浏览操作
(有多少条用户为13245,商品为7789,日期为28天,操作为浏览的记录)

X1:考察日前一天该用户对该商品是否进行了加入购物车操作
(用户13245是否在28天将商品7789加入了购物车)
X2:考察日前一周该用户是否购买了该商品
(用户13245是否在第22天到第28天中对商品7789有购买的记录)

 

三 、线下如何实现

(1)推荐使用 linux ubuntu, mac os
2更多的参考资料

1. Logistic Regression:
http://blog.csdn.net/zouxy09/article/details/20319673
2.Python basic:http://www.dotnetperls.com/python
3. Sklearn with Python:
http://kukuruku.co/hub/python/introduction-to-machine-learning-with- python-andscikit-learn

(3)环境安装 python numpy sklearn

1.读取线下训练的候选对象、线下评估的候选对象、线上评估的候选对象

2.统计所有对象的特征向量以及训练样本标签

3.训练模型

4.使用模型进行线下预测、评估、线上预测

相关文章
|
13天前
|
机器学习/深度学习 人工智能 算法
深度学习入门:理解神经网络与反向传播算法
【9月更文挑战第20天】本文将深入浅出地介绍深度学习中的基石—神经网络,以及背后的魔法—反向传播算法。我们将通过直观的例子和简单的数学公式,带你领略这一技术的魅力。无论你是编程新手,还是有一定基础的开发者,这篇文章都将为你打开深度学习的大门,让你对神经网络的工作原理有一个清晰的认识。
|
2月前
|
机器学习/深度学习 人工智能 算法
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
本文全面介绍了人工智能(AI)的基础知识、操作教程、算法实现及其在实际项目中的应用。首先,从AI的概念出发,解释了AI如何使机器具备学习、思考、决策和交流的能力,并列举了日常生活中的常见应用场景,如手机助手、推荐系统、自动驾驶等。接着,详细介绍了AI在提高效率、增强用户体验、促进技术创新和解决复杂问题等方面的显著作用,同时展望了AI的未来发展趋势,包括自我学习能力的提升、人机协作的增强、伦理法规的完善以及行业垂直化应用的拓展等...
159 3
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
|
3月前
|
机器学习/深度学习 数据采集 人工智能
机器学习算法入门与实践
【7月更文挑战第22天】机器学习算法入门与实践是一个既充满挑战又极具吸引力的过程。通过掌握基础知识、理解常见算法、注重数据预处理和模型选择、持续学习新技术和参与实践项目,你可以逐步提高自己的机器学习技能,并在实际应用中取得优异的成绩。记住,机器学习是一个不断迭代和改进的过程,保持好奇心和耐心,你将在这个领域走得更远。
|
3月前
|
消息中间件 存储 算法
实战算法的基础入门(2)
实战算法的基础入门
|
3月前
|
算法 大数据
实战算法的基础入门(1)
实战算法的基础入门
|
3月前
|
算法 Java
实战算法的基础入门(3)
实战算法的基础入门
|
2月前
|
存储 算法
【C算法】编程初学者入门训练140道(1~20)
【C算法】编程初学者入门训练140道(1~20)
|
4月前
|
算法 程序员
高阶算法班从入门到精通之路
高阶算法班从入门到精通之路
31 3
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习算法入门:从K-means到神经网络
【6月更文挑战第26天】机器学习入门:从K-means到神经网络。文章涵盖了K-means聚类、逻辑回归、决策树和神经网络的基础原理及应用场景。K-means用于数据分组,逻辑回归适用于二分类,决策树通过特征划分做决策,神经网络则在复杂任务如图像和语言处理中大显身手。是初学者的算法导览。
|
4月前
|
自然语言处理 算法
ransformers从入门到精通:常用的subword tokenizer算法
- WordPiece、BPE/BBPE最小字词进行合并最终字词,BPE/BBPE直接采用词频判断合并规则而WordPiece采用最大似然的方式 - unigram采用从最大的字词集合里移除那些对语料库整体概率贡献最小的子词【6月更文挑战第7天】
85 3
下一篇
无影云桌面