ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生

简介: ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生

输出结果


type: <class 'pandas.core.frame.DataFrame'>

  customer_id zip_code           join_date date_of_birth

0            1    60091 2011-04-17 10:48:33    1994-07-18

1            2    13244 2012-04-15 23:31:04    1986-08-18

2            3    13244 2011-08-13 15:42:34    2003-11-21

3            4    60091 2011-04-08 20:08:14    2006-08-15

4            5    60091 2010-07-17 05:27:50    1984-07-28

feature_matrix_customers

            zip_code  DAY(date_of_birth)  DAY(join_date)  \

customer_id                                                

1              60091                  18              17  

2              13244                  18              15  

3              13244                  21              13  

            MONTH(date_of_birth)  MONTH(join_date)  WEEKDAY(date_of_birth)  \

customer_id                                                                  

1                               7                 4                       0  

2                               8                 4                       0  

3                              11                 8                       4  

            WEEKDAY(join_date)  YEAR(date_of_birth)  YEAR(join_date)  

customer_id                                                            

1                             6                 1994             2011  

2                             6                 1986             2012  

3                             5                 2003             2011  

features_defs_customers: 9 [<Feature: zip_code>, <Feature: DAY(date_of_birth)>, <Feature: DAY(join_date)>, <Feature: MONTH(date_of_birth)>, <Feature: MONTH(join_date)>, <Feature: WEEKDAY(date_of_birth)>, <Feature: WEEKDAY(join_date)>, <Feature: YEAR(date_of_birth)>, <Feature: YEAR(join_date)>]

<Feature: MONTH(date_of_birth)>

The month of the "date_of_birth".

image.png

image.png




设计思路

image.png











相关文章
|
3月前
|
数据采集 机器学习/深度学习 数据可视化
关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理,进行数据探索,选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。
【7月更文挑战第5天】这是一个关于Python数据分析项目的简要概述:从CSV加载数据,执行数据预处理(填充缺失值,处理异常值),进行数据探索(可视化和统计分析),选择线性回归模型进行训练,评估模型性能并优化,最后结果解释与可视化。此案例展示了数据科学的典型流程。
57 2
|
4月前
|
算法 数据挖掘 数据处理
数据分析之可重复与独立样本的T-Test分析
数据分析之可重复与独立样本的T-Test分析
33 2
|
5月前
|
数据可视化
R语言建立和可视化混合效应模型mixed effect model
R语言建立和可视化混合效应模型mixed effect model
|
12月前
|
数据采集 机器学习/深度学习 数据处理
类别数据处理:你必须知道的技巧与方法
类别数据处理:你必须知道的技巧与方法
116 0
|
机器学习/深度学习 算法 数据处理
ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略
ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略
ML之FE:数据处理—特征工程之稀疏特征的简介、如何处理、案例应用之详细攻略
|
物联网 TensorFlow 算法框架/工具
联邦学习 (FL) 中常见的3种模型聚合方法的 Tensorflow 示例
联合学习 (FL) 是一种出色的 ML 方法,它使多个设备(例如物联网 (IoT) 设备)或计算机能够在模型训练完成时进行协作,而无需共享它们的数据。
361 0
联邦学习 (FL) 中常见的3种模型聚合方法的 Tensorflow 示例
|
Python
Hap-Eval:Sentieon团队开发的开源结构变异SV准确率评估工具
Hap-eval基于单倍型 (haplotype) 对两组SV结果进行比较,首先会将比较区块内的SV拼接成单倍型序列,如果SV的结果中有定相信息,在这一步也可以被利用;然后这些单倍型序列被用来建立一个矩阵,进行结果判断。
154 0
Hap-Eval:Sentieon团队开发的开源结构变异SV准确率评估工具
|
机器学习/深度学习 缓存 JSON
快速入门DVC(六):指标跟踪、更新训练参数以及可视化模型表现
在上一篇文章快速入门DVC(五):数据流水线中,讲述了如何完成一个机器学习模型训练流水线,以及如何重现机器学习模型。本文接下来将讲述 DVC 如何进行模型指标跟踪、修改训练参数重新训练以及使用图表可视化模型表现。
|
机器学习/深度学习 数据可视化 测试技术
你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)(下)
想象一下,你训练了一个机器学习模型。 也许,有几个候选模型可供选择。 您在测试集上运行它们并获得了一些质量估计。 模型没有过拟合。 特征是有意义的。 总体而言,鉴于手头的数据有限,它们的表现尽他们所能。 现在,是时候决定它们中的任何一个是否足以用于生产用途。 除了标准性能检查之外,如何评估和比较您的模型? 在本教程中,我们将通过一个示例详细介绍如何评估您的模型。
|
机器学习/深度学习 测试技术 BI
你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)(上)
想象一下,你训练了一个机器学习模型。 也许,有几个候选模型可供选择。 您在测试集上运行它们并获得了一些质量估计。 模型没有过拟合。 特征是有意义的。 总体而言,鉴于手头的数据有限,它们的表现尽他们所能。 现在,是时候决定它们中的任何一个是否足以用于生产用途。 除了标准性能检查之外,如何评估和比较您的模型? 在本教程中,我们将通过一个示例详细介绍如何评估您的模型。
下一篇
无影云桌面