数学建模国赛:python机器学习基础之训练集和测试集拆分、算法精确率评估

简介: 数学建模国赛:python机器学习基础之训练集和测试集拆分、算法精确率评估

在实际训练中,经常会把训练数据进一步拆分成训练集和测试集这样有助于模型选取。


想要数据集或者有不明白的请点赞关注后私信博主


Sklearn中的train_test_spilt函数是交叉验证常用的函数,功能是从样本中随机地按比例选取训练集和测试集


原数据如下:

1666425527561.jpg

拆分后效果如下

1666425539917.jpg1666425548867.jpg


ton代码如下

from sklearn import  preprocessing
from sklearn.model_selection import  train_test_split
import pandas as pd
import  numpy as np
data1=pd.read_csv(r'CatInfo.csv',",")
print(data1)
df=pd.DataFrame(data1)
car_train_x,cat_test_x,cat_train_y,cat_test_y=train_test_split(df['Lwsk'],df['LEar'],test_size=0.3,random_state=0)
print('trainx\n',car_train_x)
print('trainy\n',cat_train_y)
print('testx\n',cat_test_x)
print('testy\n',cat_test_y)


同样地 对训练出来的结果进行精确率的评估也是非常重要的sklearn里同样提供里评估的函数


具体评估因子有 1:精确率 2:召回率 3:F-measure指数等等


效果图如下

1666425517005.jpg


代码如下

from sklearn.metrics import classification_report
y_true=[0,1,2,2,2]
y_pred=[0,0,2,2,1]
print(classification_report(y_true,y_pred))


相关文章
|
13天前
|
机器学习/深度学习 自然语言处理 算法
|
1天前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
19 1
|
6天前
|
机器学习/深度学习 数据可视化 数据挖掘
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
18 1
|
6天前
|
算法 数据可视化 Python
Python贝叶斯推断Metropolis-Hastings(M-H)MCMC采样算法的实现
Python贝叶斯推断Metropolis-Hastings(M-H)MCMC采样算法的实现
|
6天前
|
机器学习/深度学习 存储 算法
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
26 7
|
7天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
11 0
|
7天前
|
机器学习/深度学习 算法 Python
使用Python实现集成学习算法:Bagging与Boosting
使用Python实现集成学习算法:Bagging与Boosting
18 0
|
8天前
|
缓存 算法 Python
python算法对音频信号处理Sonification :Gauss-Seidel迭代算法
python算法对音频信号处理Sonification :Gauss-Seidel迭代算法
|
8天前
|
机器学习/深度学习 人工智能 分布式计算
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
13 0
|
11天前
|
算法 数据可视化 数据挖掘
使用Python实现DBSCAN聚类算法
使用Python实现DBSCAN聚类算法
150 2

热门文章

最新文章