数据分享|Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

简介: 数据分享|Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

原文链接:http://tecdat.cn/?p=26999


Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。它是一种用于频繁项集挖掘的算法,允许公司理解和组织向上销售和交叉销售活动。


最强大的应用程序之一是我们在亚马逊上在线购物时看到的推荐系统 - 以及当今几乎所有电子商务网站上都存在的各种其他版本。

这是为了帮助理解一个非常简单的数据集查看文末了解数据获取方式,其中包含单个国际标准书号 (ISBN),它是一本书的唯一国际出版商标识符号。每行代表购买了所列书籍的唯一客户。

目标是了解基本购买行为,向客户推荐的其他书籍是什么——这样它可以提高公司的收入以及对所提供服务的整体满意度。

我们以网络图结束,该图展示了置信度高于 55% 的关系。


设置和导入数据集


import numpy as np
import pandas as pd
data.head()

data.shape

数据集上的EDA


#执行堆叠的步骤,转换为字符串,包括删除索引
dt2 = pd.DataFrame
dt2 = dt2.reset_index(drop = True)

dt2.nunique()  # 总共有4,999本独特的书籍

#数据集中购买最多的前10本书
top0 = pd.DataFrame(dt2.value_counts(sort= True, ascending=False).head(10))
to10

# 创建条形图 
plt.bar(t0.index, top_10\['Frequency'\])


点击标题查阅往期内容


【视频】关联规则模型、Apriori算法及R语言挖掘商店交易数据与交互可视化|数据分享


01

02

03

04

预处理


tdf = t.fit(d2).transform(da2)

ted = t.fit(r).transform(tr)
t_f

tdf = df.astype("int")
t_f

oks = d.DataFrame(tf, columns=e.columns_)
bos.head()

建立Apriori模型


runets = apriori(o2, min\_support=0.01, use\_colnames=True)
feqts

fetes.sort_values( by = \['support'\] ,ascending = False)
rls  =  assoc(fret, metric = "lift", min_threshold = 1)

re.solues('confidence', ascending = False)
ruls.head()

rul = rls\[res\['confidence'\] >= 0.55\]
rue

结论网络图


fig, ax = plt.subplots(figsize = (10,6))
G = x.from\_pandas\_edgelist(ul,source = 'antecedents')
n.draw(A)

相关文章
|
4月前
|
存储 分布式计算 大数据
基于Python大数据的的电商用户行为分析系统
本系统基于Django、Scrapy与Hadoop技术,构建电商用户行为分析平台。通过爬取与处理海量用户数据,实现行为追踪、偏好分析与个性化推荐,助力企业提升营销精准度与用户体验,推动电商智能化发展。
|
4月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的台风灾害分析及预测系统
针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。
|
4月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
5月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
545 102
|
5月前
|
数据采集 机器学习/深度学习 算法框架/工具
Python:现代编程的瑞士军刀
Python:现代编程的瑞士军刀
402 104
|
5月前
|
人工智能 自然语言处理 算法框架/工具
Python:现代编程的首选语言
Python:现代编程的首选语言
313 103
|
5月前
|
机器学习/深度学习 人工智能 数据挖掘
Python:现代编程的首选语言
Python:现代编程的首选语言
249 82
|
4月前
|
Python
Python编程:运算符详解
本文全面详解Python各类运算符,涵盖算术、比较、逻辑、赋值、位、身份、成员运算符及优先级规则,结合实例代码与运行结果,助你深入掌握Python运算符的使用方法与应用场景。
351 3
|
4月前
|
数据处理 Python
Python编程:类型转换与输入输出
本教程介绍Python中输入输出与类型转换的基础知识,涵盖input()和print()的使用,int()、float()等类型转换方法,并通过综合示例演示数据处理、错误处理及格式化输出,助你掌握核心编程技能。
583 3

推荐镜像

更多