特征工程(Feature Enginnering)学习记要

简介:
最近学习特征工程(Feature Enginnering)的相关技术,主要包含两块:特征选取(Feature Selection)和特征抓取(Feature Extraction)。这里记录一些要点,作为备忘。

 
特征选取
 
R中的FSelector包实现了一些特征选取的算法,主要分两大类:
 
Algorithms for filtering attributes: cfs, chi.squared, information.gain, gain.ratio, symmetrical.uncertainty, linear.correlation, rank.correlation, oneR, relief, consistency, random.forest.importance
属性过滤器:直接通过一些统计指标,计算变量与y的关系,然后根据一定规则选取理想的值。

Algorithms for wrapping classifiers and search attribute subset space: best.first.search, backward.search, forward.search, hill.climbing.search
分类器包装:通过包装特定的分类/回归算法,并使用一些通用的优化算法,选取具有最有效果的属性组合。
 
属性过滤器可能效率更高,但是效果不直接。而分类包装器可能效果更直接,但是计算开销大。
 
特征抓取
 
主要是重已有的数据中,创建新的数据。
Design Userful Features这篇文章,通过轴承的例子,从三个方面描述了特征抓取的方法,
  1. 领域知识:这点最好与领域专家一起讨论
  2. 统计量:无需领域知识,通用的统计量,如均值,中位数,分位数,最大最小值,偏度,峰度等
  3. 数据可视化:通过闪点图,分布度等方法,找到特殊的特殊性,创建feature。可视化之前需要预处理数据,如傅里叶变化,PCA,查看原始数据等。
 
参考
 
声明:如有转载本博文章,请注明出处。您的支持是我的动力!文章部分内容来自互联网,本人不负任何法律责任。
本文转自bourneli博客园博客,原文链接:http://www.cnblogs.com/bourneli/p/4106605.html ,如需转载请自行联系原作者
相关文章
|
Kubernetes 安全 Cloud Native
云原生|kubernetes|pod或容器的安全上下文配置解析
云原生|kubernetes|pod或容器的安全上下文配置解析
901 0
|
NoSQL 前端开发 Java
Redis使用系列) Springboot 使用redis实现接口幂等性拦截 十一
Redis使用系列) Springboot 使用redis实现接口幂等性拦截 十一
432 0
Redis使用系列) Springboot 使用redis实现接口幂等性拦截 十一
AC/DC电源模块如何做到更大的输出功率
提升AC/DC电源模块输出功率的关键在于:优化变压器设计,采用高效磁芯材料和多级结构;选择低损耗、高开关频率的功率开关器件,如MOSFET、IGBT,并行或串联使用;强化散热系统以保证高温下稳定工作;以及选取高效电源拓扑结构。这些方法满足高功率需求,提升模块性能和可靠性。
|
JavaScript 前端开发 Linux
Hook神器—Frida安装
Hook神器—Frida安装
|
机器学习/深度学习 存储 编解码
首篇!BEV-Locator:多目端到端视觉语义定位网络(清华&轻舟智航)(上)
准确的定位能力是自动驾驶的基础。传统的视觉定位框架通过几何模型来解决语义地图匹配问题,几何模型依赖于复杂的参数调整,从而阻碍了大规模部署。本文提出了BEV定位器:一种使用多目相机图像的端到端视觉语义定位神经网络。具体地,视觉BEV(鸟瞰图)编码器提取多目图像并将其展平到BEV空间中。而语义地图特征在结构上嵌入为地图查询序列。然后,cross-model transformer将BEV特征和语义图查询关联起来。通过交叉注意力模块递归地查询自车的定位信息。最后,可以通过解码transformer输出来推断自车位姿。论文在大规模nuScenes和Qcraft数据集中评估了所提出的方法。
首篇!BEV-Locator:多目端到端视觉语义定位网络(清华&轻舟智航)(上)
|
Arthas Java 测试技术
深入Spring Boot:利用Arthas排查NoSuchMethodError
## 前言 有时spring boot应用会遇到`java.lang.NoSuchMethodError`的问题,下面以具体的demo来说明怎样利用[arthas](https://github.com/alibaba/arthas)来排查。 Demo: https://github.com/hengyunabc/spring-boot-inside/tree/master/dem
2857 0
|
Linux
【Linux】【CentOS】【FTP】FTP服务器安装与配置1(vsftpd、lftp)
【Linux】【CentOS】【FTP】FTP服务器安装与配置(vsftpd、lftp)
493 1
【Linux】【CentOS】【FTP】FTP服务器安装与配置1(vsftpd、lftp)
|
缓存 安全
3.2计算机网络(停止-等待协议 后退N帧协议 选择重传协议)
1.停止-等待协议 1.概念 2.停等协议——无差错情况
3.2计算机网络(停止-等待协议 后退N帧协议 选择重传协议)
|
Linux 测试技术 数据安全/隐私保护
Fedora32 Server版安装与初体验
Fedora32 Server版安装与初体验
695 0
Fedora32 Server版安装与初体验