【Python机器学习】感知器进行信用分类和使用KNN进行图书推荐实战(附源码和数据集)

简介: 【Python机器学习】感知器进行信用分类和使用KNN进行图书推荐实战(附源码和数据集)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

一、KNN进行图书推荐

KNN算法思想简介

KNN 可以说是最简单的分类算法之一,同时,它也是最常用的分类算法之一。注意:KNN 算法是有监督学习中的分类算法,它看起来和另一个机器学习算法 K-means 有点像(K-means 是无监督学习算法),但却是有本质区别的。

KNN 的全称是 K Nearest Neighbors,意思是 K 个最近的邻居。从这个名字我们就能看出一些 KNN 算法的蛛丝马迹了。K 个最近邻居,毫无疑问,K 的取值肯定是至关重要的,那么最近的邻居又是怎么回事呢?其实,KNN 的原理就是当预测一个新的值 x 的时候,根据它距离最近的 K 个点是什么类别来判断 x 属于哪个类别。

要度量空间中点距离的话,有好几种度量方式,比如常见的曼哈顿距离计算、欧式距离计算等等。不过通常 KNN 算法中使用的是欧式距离。这里只是简单说一下,拿二维平面为例,二维空间两个点的欧式距离计算公式如下:

该如何确定 K 取多少值好呢?答案是通过交叉验证(将样本数据按照一定比例,拆分出训练用的数据和验证用的数据,比如6:4拆分出部分训练数据和验证数据),从选取一个较小的 K 值开始,不断增加 K 的值,然后计算验证集合的方差,最终找到一个比较合适的 K 值。

 

描述:下面比表7.5中是一个图书网站的数据,有5位用户对4本图书进行了评分。详细评分的值越大表示喜好越强烈。使用KNN模型找出与用户F最相似的用户。

预测结果如下 用户C与用户F喜好最为相似

部分代码如下

# -*- coding: utf-8 -*-
import numpy as np
from sklearn import neighbors
knn = neighbors.KNeighborsClassifier(1)   #取得 knn 分类器
data = np.array([[1.1, 1.5, 1.4, 0.2],
                 [1.9, 1.0, 1.4 ,0.2],
                 [1.7, 1.2, 1.3, 0.2],
                 [2.6, 2..2]])
labels = np.array(['A','B','C','D','E'])
knn.fit(data)
print("预测结果:",knn.predict(np.array([[1.6, 1.5, 1.2, 0.1]]).reshape(1,-1)))

二、使用感知器Perceptron进行信用分类

感知机(perceptron),又称“人工神经元”或“朴素感知机”,由Frank Rosenblatt于1957年提出。作为神经网络的起源算法,通过深入学习可以帮助我们更好的理解神经网络的部分工作原理。

感知机接受多个输入信号,输出一个信号。感知机的信号只有“0(不传递信号)”和“1(传递信号)”两种。

单个感知机的局限性就在于它只能表示由一条直线分割的空间,对于非线性问题(即线性不可分问题)仅用单个感知机无法解决。

使用感知器对信用分类结果如下

可以看出有一条很明显的分界线将信用分成两个部分

部分代码如下

# -*- encoding:utf-8 -*-
from sklearn.linear_model import Perceptron
from sklearn.cross_validation import train_test_split
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
def loaddata(): 
    people = pd.read_csv("credit-overdue.csv", header=0) # 加载数据集
    X = people[['debt','income']].values
    y = people['overdue'].values
    return X,y 
print("Step1:read data...")
x,y=loaddata() 
#拆分为训练数据和测试数据
print("Step2:fit by Perceptron...")
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=0) 
#将两类值分别存放、以便显示
positive_x1=[x[i,0]for i in range(len(y)) if y[i]==1]
positive_x2range(len(y)) if y[i]==0] 
#定义感知机
clf=Perceptron(n_iter=100)
clf.fit(x_train,y_train)
print("Step3:get the weights and bias...")
#得到结果参数
weights=clf.coef_
bias=clf.intercept_
print('  权重为:',weights,'\n  截距为:',bias)
print("Step4:compute the accuracy...")    
#使用测p5:draw with the weights and bias...")
plt.scatter(positive_x1,positive_x2, marker='^',c='red')
plt.scatter(negetive_x1,negetive_x2,c='blue')
#显示感知机生成的分类线 
line_x=np.arange(0,4)
line_y=line_x*(-weights[0][0]/weights[0][1])-bias
plt.plot(line_x,line_y)
plt.show()

创作不易 觉得有帮助请点赞关注收藏~~~

相关文章
|
机器学习/深度学习 算法 Python
机器学习特征筛选:向后淘汰法原理与Python实现
向后淘汰法(Backward Elimination)是机器学习中一种重要的特征选择技术,通过系统性地移除对模型贡献较小的特征,以提高模型性能和可解释性。该方法从完整特征集出发,逐步剔除不重要的特征,最终保留最具影响力的变量子集。其优势包括提升模型简洁性和性能,减少过拟合,降低计算复杂度。然而,该方法在高维特征空间中计算成本较高,且可能陷入局部最优解。适用于线性回归、逻辑回归等统计学习模型。
530 7
|
12月前
|
机器学习/深度学习 人工智能 算法
Scikit-learn:Python机器学习的瑞士军刀
想要快速入门机器学习但被复杂算法吓退?本文详解Scikit-learn如何让您无需深厚数学背景也能构建强大AI模型。从数据预处理到模型评估,从垃圾邮件过滤到信用风险评估,通过实用案例和直观图表,带您掌握这把Python机器学习的'瑞士军刀'。无论您是AI新手还是经验丰富的数据科学家,都能从中获取将理论转化为实际应用的关键技巧。了解Scikit-learn与大语言模型的最新集成方式,抢先掌握机器学习的未来发展方向!
1324 12
Scikit-learn:Python机器学习的瑞士军刀
|
机器学习/深度学习 数据可视化 TensorFlow
Python 高级编程与实战:深入理解数据科学与机器学习
本文深入探讨了Python在数据科学与机器学习中的应用,介绍了pandas、numpy、matplotlib等数据科学工具,以及scikit-learn、tensorflow、keras等机器学习库。通过实战项目,如数据可视化和鸢尾花数据集分类,帮助读者掌握这些技术。最后提供了进一步学习资源,助力提升Python编程技能。
|
机器学习/深度学习 数据可视化 算法
Python 高级编程与实战:深入理解数据科学与机器学习
在前几篇文章中,我们探讨了 Python 的基础语法、面向对象编程、函数式编程、元编程、性能优化和调试技巧。本文将深入探讨 Python 在数据科学和机器学习中的应用,并通过实战项目帮助你掌握这些技术。
|
存储 缓存 NoSQL
实战|教你用Python玩转Redis
之前辰哥已经给大家教了Python如何去连接Mysql(实战|教你用Python玩转Mysql),并进行相应操作(插、查、改、删)。除了Mysql外,Python最常搭配的数据库还有Redis。 那么今天辰哥就来给大家讲解一下Python如何使用Redis,并进行相关的实战操作。
765 0
|
8月前
|
数据采集 机器学习/深度学习 人工智能
Python:现代编程的首选语言
Python:现代编程的首选语言
1276 102
|
8月前
|
数据采集 机器学习/深度学习 算法框架/工具
Python:现代编程的瑞士军刀
Python:现代编程的瑞士军刀
461 104
|
8月前
|
人工智能 自然语言处理 算法框架/工具
Python:现代编程的首选语言
Python:现代编程的首选语言
356 103
|
8月前
|
机器学习/深度学习 人工智能 数据挖掘
Python:现代编程的首选语言
Python:现代编程的首选语言
370 82
|
7月前
|
Python
Python编程:运算符详解
本文全面详解Python各类运算符,涵盖算术、比较、逻辑、赋值、位、身份、成员运算符及优先级规则,结合实例代码与运行结果,助你深入掌握Python运算符的使用方法与应用场景。
465 3

推荐镜像

更多