# PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-4

PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-3

https://developer.aliyun.com/article/1489342

## KNN近邻

classifier = KNeighborsClassifier(n_neighbors =13,metric = 'minkowski' , p=2)
print("Mean accuracy: ",accuracyknn/K)
print("The best AUC: ", bestaucknn)
$\[7952 30$
$1046 15$\]

$\[7987 30$
$1010 15$\]

$\[7989 23$
$1017 13$\]

$\[7920 22$
$1083 17$\]

$\[7948 21$
$1052 21$\]

## 高斯朴素贝叶斯

kf = KFold(n_splits=K, shuffle=True)
gaussian = GaussianNB()
$\[7340 690$
$682 331$\]

$\[7321 633$
$699 389$\]

$\[7291 672$
$693 386$\]

$\[7300 659$
$714 369$\]

$\[7327 689$
$682 344$\]


models = pd.DataFrame({
'Model': $'KNN', 'Logistic Regression', 'Naive Bayes', 'Decision Tree','Random Forest'$,
'Score': $accuracyknn/K, accuracylogreg/K, accuracygnb/K, accuracydt/K, accuracyrf/K$,
'BestAUC': $bestaucknn,bestauclogreg,bestaucgnb, bestaucdt,bestaucrf$})

# 欠采样

gTrain, gValid = train\_test\_split

## 逻辑回归

predsTrain = logreg.predict(gTrainUrandom)

predsTrain = logreg.predict(gTrain20Urandom)

predsTrain = logreg.predict(gTrrandom)

## 决策树


print("Train AUC:", metrics.roc\_auc\_score(ygTrds))

## 随机森林

print("Train AUC:", metrics.roc\_auc\_score(ygTr, predsTrain),
"Valid AUC:", metrics.roc\_auc\_score(ygVd, preds))

## KNN近邻

print("Train AUC:", metrics.roc\_auc\_score(ygTrm, predsTrain),
"Valid AUC:", metrics.roc\_auc\_score(ygVal10, preds))

## 高斯朴素贝叶斯

print("Train AUC:", metrics.roc\_auc\_score(ygTraom, predsTrain),
"Valid AUC:", metrics.roc\_auc\_score(ygid, preds))

# 过采样

feates = datolist()
print(feures)
feaes.remove('y')

print(gTrainOSM.shape)
(31945, 39)

smt = SMOT
(32345, 39)

smt = SMOT
(32595, 39)

ygTrain10OSM=gTrain10OSM$'y'$
gTrain10OSM=gTrain10OSM.drop(columns=$'y'$)

## 逻辑回归

print("Train AUC:", metrics.roc\_auc\_score(ygTrin10SM, predsTrain),
"Valid AUC:", metrics.roc\_auc\_score(ygValid, preds))

## 决策树

dt2.fit(,ygTranOS)
predsTrain = dtpreict(TrainOSM)
preds = dt2.predict(gValid)

## 随机森林

random_forest.fit(rainOSM, ygTranOS)
predsTrain = random_forest.prect(gTraiOSM)
p

## KNN近邻

classifier.fit(granOSM, yTanOSM)
predsTrain = classifier.predict(gTaiSM)
preds = classifier.predict(Vaid)

## 高斯朴素贝叶斯

gaussian.fit(gTriOM, ygrainM)
predsTrain = gaussian.predcti)

# 结论

|
5天前
|

【6月更文挑战第13天】联邦学习是保障数据隐私的分布式机器学习方法，它在不暴露数据的情况下，通过在各设备上本地训练并由中心服务器协调，实现全局模型构建。联邦学习的优势在于保护隐私、提高训练效率和增强模型泛化。已应用于医疗、金融和物联网等领域。未来趋势包括更高效的数据隐私保护、提升可解释性和可靠性，以及与其他技术融合，有望在更多场景发挥潜力，推动机器学习发展。
15 4
|
2天前
|

17 5
|
4天前
|

【阿旭机器学习实战】【34】使用SVM检测蘑菇是否有毒--支持向量机
【阿旭机器学习实战】【34】使用SVM检测蘑菇是否有毒--支持向量机
11 0
|
5天前
|

【6月更文挑战第13天】文本分类是机器学习在数字化时代的关键应用，涉及文本预处理、特征提取和模型训练等步骤。常见方法包括基于规则、关键词和机器学习，其中机器学习（如朴素贝叶斯、SVM、深度学习）是主流。在Python中，可使用scikit-learn进行文本分类，例如通过TF-IDF和朴素贝叶斯对新闻数据集进行处理和预测。随着技术发展，未来将深入探索深度学习和多模态数据在文本分类中的应用。
15 2
|
5天前
|

Python机器学习工具与库的现状，并展望其未来的发展趋势
【6月更文挑战第13天】本文探讨了Python在机器学习中的核心地位，重点介绍了Scikit-learn、TensorFlow、PyTorch等主流库的现状。未来发展趋势包括自动化、智能化的工具，增强可解释性和可信赖性的模型，跨领域融合创新，以及云端与边缘计算的结合。这些进展将降低机器学习门槛，推动技术在各领域的广泛应用。
9 3
|

【Python数据科学手册】专题：决策树与随机森林

799 0
|

Python 数据科学手册 5.8 决策树和随机森林
5.8 决策树和随机森林 原文：In-Depth: Decision Trees and Random Forests 译者：飞龙 协议：CC BY-NC-SA 4.0 译文没有得到原作者授权，不保证与原文的意思严格一致。
1275 0
|
2天前
|
Shell Python
GitHub星标破千Star！Python游戏编程的初学者指南
Python 是一种高级程序设计语言，因其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。 目前的编程书籍大多分为两种类型。第一种，与其说是教编程的书，倒不如说是在教“游戏制作软件”，或教授使用一种呆板的语言，使得编程“简单”到不再是编程。而第二种，它们就像是教数学课一样教编程：所有的原理和概念都以小的应用程序的方式呈现给读者。
6 1
|
2天前
|

Python 语言是一种脚本语言，其应用领域非常广泛，包括数据分析、自然语言处理机器学习、科学计算、推荐系统构建等。 能够轻松实现和代码跑得够快之间的取舍却是一个世人皆知且令人惋惜的现象而这个问题其实是可以解决的。 有些人想要让顺序执行的过程跑得更快。有些人需要利用多核架构、集群，或者图形处理单元的优势来解决他们的问题。有些人需要可伸缩系统在保证可靠性的前提下酌情或根据资金多少处理更多或更少的工作。有些人意识到他们的编程技巧，通常是来自其他语言，可能不如别人的自然。
8 1
|
2天前
|

GitHub高赞！速通Python编程基础手册，被玩出花了！

11 2