ML之分类预测:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类模型评估案例来理解和认知机器学习分类预测的模板流程

简介: ML之分类预测:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类模型评估案例来理解和认知机器学习分类预测的模板流程


目录

六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测

数据集理解

1、kNN

2、逻辑回归

3、SVM

4、决策树

5、随机森林

6、提升树

7、神经网络


 

相关文章

ML之分类预测:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类模型评估案例来理解和认知机器学习分类预测

ML之分类预测:以六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类模型评估案例来理解和认知机器学习分类预测应用

 

六类机器学习算法(kNN、逻辑回归、SVM、决策树、随机森林、提升树、神经网络)对糖尿病数据集(8→1)实现二分类预测

数据集理解

1. data.shape:  (768, 9)
2. data.columns: 
3.  Index(['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin',
4. 'BMI', 'DiabetesPedigreeFunction', 'Age', 'Outcome'],
5.       dtype='object')
6. data.head: 
7.     Pregnancies  Glucose  BloodPressure  ...  DiabetesPedigreeFunction  Age  Outcome
8. 0            6      148             72  ...                     0.627   50        1
9. 1            1       85             66  ...                     0.351   31        0
10. 2            8      183             64  ...                     0.672   32        1
11. 3            1       89             66  ...                     0.167   21        0
12. 4            0      137             40  ...                     2.288   33        1
13. 
14. [5 rows x 9 columns]
15. <class 'pandas.core.frame.DataFrame'>
16. RangeIndex: 768 entries, 0 to 767
17. Data columns (total 9 columns):
18. #   Column                    Non-Null Count  Dtype  
19. ---  ------                    --------------  -----  
20. 0   Pregnancies               768 non-null    int64  
21. 1   Glucose                   768 non-null    int64  
22. 2   BloodPressure             768 non-null    int64  
23. 3   SkinThickness             768 non-null    int64  
24. 4   Insulin                   768 non-null    int64  
25. 5   BMI                       768 non-null    float64
26. 6   DiabetesPedigreeFunction  768 non-null    float64
27. 7   Age                       768 non-null    int64  
28. 8   Outcome                   768 non-null    int64  
29. dtypes: float64(2), int64(7)
30. memory usage: 54.1 KB
31. data.info: 
32. None
33. 8
34. data_column_X:  ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age'] 
35.  ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age']

 

1、kNN

1. kNNC(n_neighbors=9):Training set accuracy: 0.792
2. kNNC(n_neighbors=9):Test set accuracy: 0.776

 

 

2、逻辑回归

1. LoR(c_regular=1):Training set accuracy: 0.785
2. LoR(c_regular=1):Test set accuracy: 0.771

 

 

 

3、SVM

1. SVMC_Init:Training set accuracy: 0.769
2. SVMC_Init:Test set accuracy: 0.755
3. SVMC_Best(max_dept=1,learning_rate=0.1):Training set accuracy: 0.788
4. SVMC_Best(max_dept=1,learning_rate=0.1):Test set accuracy: 0.781
5. DTC(max_dept=3):Training set accuracy: 0.773
6. DTC(max_dept=3):Test set accuracy: 0.740

 

4、决策树

1. DTC(max_dept=3):Training set accuracy: 0.773
2. DTC(max_dept=3):Test set accuracy: 0.740

 

5、随机森林

1. RFC_Best:Training set accuracy: 0.764
2. RFC_Best:Test set accuracy: 0.750

 

6、提升树

1. GBC(max_dept=1,learning_rate=0.1):Training set accuracy: 0.804
2. GBC(max_dept=1,learning_rate=0.1):Test set accuracy: 0.781

 

7、神经网络

1. MLPC_Init:Training set accuracy: 0.743
2. MLPC_Init:Test set accuracy: 0.672

 

相关文章
|
1月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习算法篇】K-近邻算法
K近邻(KNN)是一种基于“物以类聚”思想的监督学习算法,通过计算样本间距离,选取最近K个邻居投票决定类别。支持多种距离度量,如欧式、曼哈顿、余弦相似度等,适用于分类与回归任务。结合Scikit-learn可高效实现,需合理选择K值并进行数据预处理,常用于鸢尾花分类等经典案例。(238字)
|
6月前
|
机器学习/深度学习 数据采集 人工智能
20分钟掌握机器学习算法指南
在短短20分钟内,从零开始理解主流机器学习算法的工作原理,掌握算法选择策略,并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻,帮助你告别算法选择的困惑,轻松踏入AI的大门。
|
7月前
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
303 6
|
9月前
|
人工智能 编解码 算法
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
216 0
|
11月前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
263 17
|
11月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
223 10
|
11月前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。
|
11月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
在数字化时代,网络安全和信息安全已成为我们生活中不可或缺的一部分。本文将介绍网络安全漏洞、加密技术和安全意识等方面的内容,并提供一些实用的代码示例。通过阅读本文,您将了解到如何保护自己的网络安全,以及如何提高自己的信息安全意识。
233 10
|
11月前
|
监控 安全 网络安全
网络安全与信息安全:漏洞、加密与意识的交织
在数字时代的浪潮中,网络安全与信息安全成为维护数据完整性、保密性和可用性的关键。本文深入探讨了网络安全中的漏洞概念、加密技术的应用以及提升安全意识的重要性。通过实际案例分析,揭示了网络攻击的常见模式和防御策略,强调了教育和技术并重的安全理念。旨在为读者提供一套全面的网络安全知识框架,从而在日益复杂的网络环境中保护个人和组织的资产安全。