ML之FE:特征工程中的特征拼接处理(常用于横向拼接自变量特征和因变量特征)(daiding)

简介: ML之FE:特征工程中的特征拼接处理(常用于横向拼接自变量特征和因变量特征)(daiding)


目录

特征工程中的特征拼接处理(常用于横向拼接自变量特征和因变量特征)

输出结果

实现代码


特征工程中的特征拼接处理(常用于横向拼接自变量特征和因变量特征)

输出结果

1. <class 'pandas.core.frame.DataFrame'>
2. RangeIndex: 768 entries, 0 to 767
3. Data columns (total 9 columns):
4. #   Column                    Non-Null Count  Dtype  
5. ---  ------                    --------------  -----  
6. 0   Pregnancies               768 non-null    int64  
7. 1   Glucose                   768 non-null    int64  
8. 2   BloodPressure             768 non-null    int64  
9. 3   SkinThickness             768 non-null    int64  
10. 4   Insulin                   768 non-null    int64  
11. 5   BMI                       768 non-null    float64
12. 6   DiabetesPedigreeFunction  768 non-null    float64
13. 7   Age                       768 non-null    int64  
14. 8   Outcome                   768 non-null    int64  
15. dtypes: float64(2), int64(7)
16. memory usage: 54.1 KB
17. None
18.    Pregnancies  Glucose  BloodPressure  SkinThickness   BMI  Outcome
19. 0            6      148             72             35  33.6        1
20. 1            1       85             66             29  26.6        0
21. 2            8      183             64              0  23.3        1
22. 3            1       89             66             23  28.1        0
23. 4            0      137             40             35  43.1        1

实现代码

1. # ML之DS:特征工程中的特征拼接处理(常用于横向拼接自变量特征和因变量特征)
2. import pandas as pd
3. 
4. data_frame=pd.read_csv('data_csv_xls\diabetes\diabetes.csv')
5. print(data_frame.info())
6. 
7. col_label='Outcome'
8. cols_other=['Pregnancies','Glucose','BloodPressure','SkinThickness','BMI']
9. data_X=data_frame[cols_other]
10. data_y_label_μ=data_frame[col_label]
11. data_dall = pd.concat([data_X, data_y_label_μ], axis=1)
12. print(data_dall.head())


相关文章
|
机器学习/深度学习
Lesson 5.3 ROC-AUC 的计算方法、基本原理与核心特性
Lesson 5.3 ROC-AUC 的计算方法、基本原理与核心特性
|
9月前
|
Web App开发 数据安全/隐私保护 虚拟化
WSL2安装及图形界面使用
WSL2安装及图形界面使用
488 0
|
9月前
|
存储 监控 NoSQL
解密推荐系统:用Redis解决特征存储问题
解密推荐系统:用Redis解决特征存储问题
279 0
|
存储 NoSQL Redis
Redis:Sorted Set类型底层数据结构剖析
Redis:Sorted Set类型底层数据结构剖析
389 0
|
SQL 自然语言处理 关系型数据库
【Hive】函数 concat 、concat_ws 、concat_group 的区别
【Hive】函数 concat 、concat_ws 、concat_group 的区别
1224 0
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比
本文介绍了处理不平衡数据集的过采样和欠采样技术,包括随机过采样、SMOTE、ADASYN、随机欠采样、Tomek Links、Near Miss 和 ENN 等方法。通过二维数据集的可视化示例,直观展示了各种方法的原理和效果差异。文章还讨论了混合采样方法(如SMOTETomek和SMOTEENN)以及应用这些方法的潜在风险,强调了在实际应用中审慎选择的重要性。
258 3
|
9月前
|
关系型数据库 分布式数据库 数据库
drds扩容缩容
drds扩容缩容
182 2
推荐6 款免费的图标编辑器
Web 设计中常用到图标,比如 Favicon,Windows 和 Mac 程序中也要用到图标,设计图标当然可以使用庞大的 Photoshop 或 Paint.NET,但也有一些免费的,简单工具可以随手拿来用,本文搜集了6款免费的图标编辑工具,有一些工具还可以从二进制文件中抽取图标。
1158 0
|
5月前
|
机器学习/深度学习 数据采集
深度学习之脑电图信号解码
基于深度学习的脑电图(EEG)信号解码是一项重要的研究领域,旨在从脑电图信号中提取有用信息,用于脑-机接口、情绪识别、疾病诊断等应用。
144 5
|
9月前
|
数据安全/隐私保护 虚拟化 Windows
如何在 VM 虚拟机中安装 Windows Server 2003 操作系统保姆级教程(附链接)
如何在 VM 虚拟机中安装 Windows Server 2003 操作系统保姆级教程(附链接)

热门文章

最新文章