一、特征工程

简介: 常用的特征工程方式?

问题:

1、常用的特征工程方式?

答:

引用图形:

6e9b370798d8a28e568c92c28cd9c65c_20171226191934966.png参考:七种常用的特征工程 https://www.cnblogs.com/peizhe123/p/7412364.html 总结的很好

1.对于不同的特征该如何进行特征工程?

(1)对于数值型特征,采用特征归一化,目的是将所有的特征统一到大致相同的我数值区间

(2)对于类别型特征,先处理成数值型特征,具体可以采用序号编码(处理类别之间具有大小关系的数据),独热编码(处理类别之间不具有大小关系的数据),二进制编码(维数少于独热编码,节省存储空间)

(3)对一阶离散特征两两组合,构成高阶特征,目的是提高复杂关系的拟合能力。

(4)文本特征,采用词袋模型和n-gram模型,主题模型,词嵌入模型

问题:

2、浅层神经网络和深层神经网络的区别?

3、生成模型和另外一种什么模型?

4、迁移学习和生成对抗网络?

5、神经网络的简单描述?

6、降维方法有哪些,和矩阵分解的关系,例如在组合特征中学习的参数维数变多有什么处理方法,?

为什么采用这样的处理方法?

7、什么叫梯度提升决策树?


目录
相关文章
|
9月前
|
数据采集 监控 安全
数据预处理
【2月更文挑战第25天】
|
7月前
|
机器学习/深度学习 人工智能
8个特征工程技巧提升机器学习预测准确性
8个特征工程技巧提升机器学习预测准确性
149 6
8个特征工程技巧提升机器学习预测准确性
|
6月前
|
机器学习/深度学习 数据采集 算法
|
9月前
|
机器学习/深度学习 数据采集 算法
DataFrame 与机器学习:数据预处理与特征工程
【5月更文挑战第19天】数据预处理(如处理缺失值、标准化)和特征工程对机器学习模型的性能至关重要。使用`pandas`进行缺失值填充,`StandardScaler`实现数据标准化,通过创建新特征(如从日期提取月份、对数变换价格)和特征组合增强信息。相关性分析帮助选择重要特征,提升模型准确性和泛化能力。灵活运用这些方法能有效提升模型性能。DataFrame简化了数据操作,助力高效机器学习。
124 1
|
9月前
|
机器学习/深度学习 数据采集 传感器
【机器学习】特征工程之特征选择
【机器学习】特征工程之特征选择
202 2
|
9月前
|
数据采集 机器学习/深度学习 Python
掌握XGBoost:特征工程与数据预处理
掌握XGBoost:特征工程与数据预处理
554 3
|
机器学习/深度学习 自然语言处理 算法
机器学习特征工程和特征提取
机器学习特征工程和特征提取
185 0
|
分布式计算 大数据 Hadoop
大数据预处理
大数据预处理
135 0
|
机器学习/深度学习 数据采集 数据处理
数据预处理与特征工程:提升机器学习模型性能
在机器学习领域,数据预处理和特征工程是构建强大、准确的模型的关键步骤。这些步骤的正确实施可以显著提高模型的性能和鲁棒性。本文将探讨数据预处理和特征工程的重要性,以及一些常用的技术和策略,帮助您在构建机器学习模型时取得更好的结果。
442 0
|
机器学习/深度学习 数据可视化 算法
特征工程之处理时间序列数据
特征工程之处理时间序列数据
347 0
特征工程之处理时间序列数据