数据分析

简介: 数据分析提供了数据集合, 应该将他们分成两类, 一个是测试类, 一个是训练类深度学习中最难的就是特征提取并不是数据中的所有特征都有用的, 没有需要的使用DataFrame中的drop()去掉one-hot: 将string值转为int值,方便运算 --> pd.

数据分析

  1. 提供了数据集合, 应该将他们分成两类, 一个是测试类, 一个是训练类
  2. 深度学习中最难的就是特征提取
  3. 并不是数据中的所有特征都有用的, 没有需要的使用DataFrame中的drop()去掉
  4. one-hot: 将string值转为int值,方便运算 --> pd.get_dummies(raw['raw_name'], prefix='my_prefix') 返回的是一个类似于真值表的表, 结果是0或者1
  5. 一个目标函数有3个参数, 那么梯度下降指定的对每一个系数单独求偏导, 互相不干扰
  6. 梯度下降的学习率就是取自变量时间隔, 一般从0.01开始, 批处理的数量是32, 64, 128, 一般64足够了
  7. 逻辑回归算法是最经典的算法, 套路就是先使用简单的逻辑回归, 是在不行了就是用其他复杂的算法
  8. sigmoid函数, g(z) = 1/(1 + e^(-z)), 它很重要, 因为它的自变量的取值范围在无穷, 而他的y的取值范围为0-1, 这就是概率的取值范围
  9. 线性回归的证明代一般高斯分布的公式, 逻辑回归一般代sigmoid函数的公式, 证明时遇到乘法使用log
目录
相关文章
|
3月前
|
数据采集 监控 数据可视化
如何进行数据分析
如何进行数据分析
58 2
|
3月前
|
数据采集 SQL 数据可视化
数据分析的要求
数据分析的要求
76 2
|
6月前
|
数据采集 存储 数据挖掘
数据分析
【6月更文挑战第16天】数据分析。
47 6
|
7月前
|
数据采集 机器学习/深度学习 人工智能
数据分析与理解
数据分析与理解
77 3
|
数据采集 SQL 算法
【数据分析】:什么是数据分析?
【数据分析】:什么是数据分析?
【数据分析】:什么是数据分析?
|
搜索推荐 数据挖掘
数据分析场景
数据分析场景
|
数据挖掘 Windows
数据分析的前世今生
数据分析的前世今生
101 0
|
数据采集 XML 存储
C++数据分析的应用
C++是一种功能强大的编程语言,提供高性能、高效性和灵活性,适用于各种应用程序。其中,数据分析是C++的一个重要领域,涉及大量数据的收集、处理和解释。C++可以有效处理使用HTTP、FTP、JSON、XML等各种协议和格式的网络通信和数据采集任务。
296 0
|
数据采集 机器学习/深度学习 人工智能
数据分析--数据分析是什么?
数据分析--数据分析是什么?
239 0
|
SQL 机器学习/深度学习 运维
聊聊数据分析
聊聊数据分析
164 0