开发者社区> 一个处女座的程序猿> 正文

ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生

简介: ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生
+关注继续查看

输出结果


type: <class 'pandas.core.frame.DataFrame'>

  customer_id zip_code           join_date date_of_birth

0            1    60091 2011-04-17 10:48:33    1994-07-18

1            2    13244 2012-04-15 23:31:04    1986-08-18

2            3    13244 2011-08-13 15:42:34    2003-11-21

3            4    60091 2011-04-08 20:08:14    2006-08-15

4            5    60091 2010-07-17 05:27:50    1984-07-28

feature_matrix_customers

            zip_code  DAY(date_of_birth)  DAY(join_date)  \

customer_id                                                

1              60091                  18              17  

2              13244                  18              15  

3              13244                  21              13  

            MONTH(date_of_birth)  MONTH(join_date)  WEEKDAY(date_of_birth)  \

customer_id                                                                  

1                               7                 4                       0  

2                               8                 4                       0  

3                              11                 8                       4  

            WEEKDAY(join_date)  YEAR(date_of_birth)  YEAR(join_date)  

customer_id                                                            

1                             6                 1994             2011  

2                             6                 1986             2012  

3                             5                 2003             2011  

features_defs_customers: 9 [<Feature: zip_code>, <Feature: DAY(date_of_birth)>, <Feature: DAY(join_date)>, <Feature: MONTH(date_of_birth)>, <Feature: MONTH(join_date)>, <Feature: WEEKDAY(date_of_birth)>, <Feature: WEEKDAY(join_date)>, <Feature: YEAR(date_of_birth)>, <Feature: YEAR(join_date)>]

<Feature: MONTH(date_of_birth)>

The month of the "date_of_birth".

image.png

image.png




设计思路

image.png











版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
联邦学习 (FL) 中常见的3种模型聚合方法的 Tensorflow 示例
联合学习 (FL) 是一种出色的 ML 方法,它使多个设备(例如物联网 (IoT) 设备)或计算机能够在模型训练完成时进行协作,而无需共享它们的数据。
37 0
从Tensorflow模型文件中解析并显示网络结构图(pb模型篇)
从Tensorflow模型文件中解析并显示网络结构图(pb模型篇)
184 0
Hap-Eval:Sentieon团队开发的开源结构变异SV准确率评估工具
Hap-eval基于单倍型 (haplotype) 对两组SV结果进行比较,首先会将比较区块内的SV拼接成单倍型序列,如果SV的结果中有定相信息,在这一步也可以被利用;然后这些单倍型序列被用来建立一个矩阵,进行结果判断。
48 0
你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)(上)
想象一下,你训练了一个机器学习模型。 也许,有几个候选模型可供选择。 您在测试集上运行它们并获得了一些质量估计。 模型没有过拟合。 特征是有意义的。 总体而言,鉴于手头的数据有限,它们的表现尽他们所能。 现在,是时候决定它们中的任何一个是否足以用于生产用途。 除了标准性能检查之外,如何评估和比较您的模型? 在本教程中,我们将通过一个示例详细介绍如何评估您的模型。
109 0
你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)(下)
想象一下,你训练了一个机器学习模型。 也许,有几个候选模型可供选择。 您在测试集上运行它们并获得了一些质量估计。 模型没有过拟合。 特征是有意义的。 总体而言,鉴于手头的数据有限,它们的表现尽他们所能。 现在,是时候决定它们中的任何一个是否足以用于生产用途。 除了标准性能检查之外,如何评估和比较您的模型? 在本教程中,我们将通过一个示例详细介绍如何评估您的模型。
38 0
multi-class分类模型评估指标的定义、原理及其Python实现
本文介绍multi-class分类任务中的模型评估指标及其使用Python的实现方式(包括使用sklearn进行实现,以及使用原生Python函数进行实现的操作)。 本文使用的示例是在英文多标签文本分类数据集AAPD数据集上,使用fastText包运算得到的多标签分类结果,与真实标签之间计算对应的指标结果(原则上使用one-label标签应该也能这么算,我就不另写了)。本文第一节将介绍相应数据的处理方式,第二节及其后是各指标的原理和计算方式。
76 0
ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生
ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生
41 0
ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生
ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生
36 0
ML之FE:基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动特征生成/特征衍生
ML之FE:基于单个csv文件数据集(自动切分为两个dataframe表)利用featuretools工具实现自动特征生成/特征衍生
66 0
ML之FE:基于BigMartSales数据集利用Featuretools工具(1个dataframe表结构切为2个Entity表结构)实现自动特征工程之详细攻略
ML之FE:基于BigMartSales数据集利用Featuretools工具(1个dataframe表结构切为2个Entity表结构)实现自动特征工程之详细攻略
28 0
+关注
一个处女座的程序猿
国内互联网圈知名博主、人工智能领域优秀创作者,全球最大中文IT社区博客专家、CSDN开发者联盟生态成员、中国开源社区专家、华为云社区专家、51CTO社区专家、Python社区专家等,曾受邀采访和评审十多次。仅在国内的CSDN平台,博客文章浏览量超过2500万,拥有超过57万的粉丝。
文章
问答
文章排行榜
最热
最新
相关电子书
更多
4个迭代,从批量交...1573957773.pdf
立即下载
图计算优化技术探索
立即下载
Blade优化技术在广告计算中的应用优化
立即下载