问题:
1、常用的特征工程方式?
答:
引用图形:
参考:七种常用的特征工程 https://www.cnblogs.com/peizhe123/p/7412364.html 总结的很好
1.对于不同的特征该如何进行特征工程?
(1)对于数值型特征,采用特征归一化,目的是将所有的特征统一到大致相同的我数值区间
(2)对于类别型特征,先处理成数值型特征,具体可以采用序号编码(处理类别之间具有大小关系的数据),独热编码(处理类别之间不具有大小关系的数据),二进制编码(维数少于独热编码,节省存储空间)
(3)对一阶离散特征两两组合,构成高阶特征,目的是提高复杂关系的拟合能力。
(4)文本特征,采用词袋模型和n-gram模型,主题模型,词嵌入模型
问题:
2、浅层神经网络和深层神经网络的区别?
3、生成模型和另外一种什么模型?
4、迁移学习和生成对抗网络?
5、神经网络的简单描述?
6、降维方法有哪些,和矩阵分解的关系,例如在组合特征中学习的参数维数变多有什么处理方法,?
为什么采用这样的处理方法?
7、什么叫梯度提升决策树?