备案控制台

开发者社区人工智能文章正文

深度学习基础知识扫盲（3）

2023-12-06 149

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 信息增益（Information Gain）P96熵的减少/减少杂质/增大纯度称为信息增益。在构建决策树中，如何选择特征先后？如何停止构建树？

深度学习基础知识扫盲（2）： https://developer.aliyun.com/article/1390827?spm=a2c6h.13148508.setting.23.23294f0eE2pG4w

信息增益（Information Gain）

P96

熵的减少/减少杂质/增大纯度称为信息增益。

在构建决策树中，如何选择特征先后？如何停止构建树？

根据信息增益的大小，信息增益越大，越先选择这个特征，当信息增益特别小时，就不在构建树。

下图是分类问题构建决策树，优先构建0.28

下图是决策树对回归问题的泛化：

one-hot enconding

适用于决策树的一种编码方式。通过将特征设置为0、1，来构建决策数。

置换抽样（Sampling with replacement）

有放回的随机抽样。

随机森林算法（random forest algorithm）

假如有n个特征，随机选取k = 根号n个特征，根据k个特征，构建决策树模型，这样构建出多个决策树模型，叫做随机森林。

clustering(聚类)

聚类属于无监督算法，目的是在无规则的数据中，找出隐藏的联系，然后将数据分类，但是我们并不知道分类的结果对不对。

K-means algorithm（K-均值算法）

聚类的典型算法之一，算法的主要思想：

1.随机选取k个点，作为k个聚簇的质心，分别计算每个数据到该质心的距离

2.重新把数据分配到距离他们最近的质心，根据重新的分组，计算每个聚簇的新质心。

3.重复上面两步骤。

K-means 的成本函数，又叫失真函数。

Elbow method：选择合适的集群的一种方法

Anomaly Detection algorithm(异常检测)

通过数据集把正常的数据，控制在一个范围，超过这个范围的数据，就有可能产生问题，我们就需要注意一下，对该数据进行更加细致的检测。

如下图，绿色数据，就是异常的数据，需要对它特殊检测。

使用Gussian分布来构建异常检测系统：

如何对异常检测算法进行评估：

recommend system

推荐系统：类似于购物网站、电影网站的推荐界面。

如何使用推荐系统预测参数呢？

推荐系统的单用户cost function：

推荐系统的所有用户之和的cost function：

Collaborative filtering（协同过滤算法）

从多个用户来收集数据，用户之间的这种协作可以帮助您预测未来甚至其他用户的评分

用已知的数据，对推荐系统的w,b,x一起学习。

以下为成本函数：

此时梯度下降：x也是一个参数

将回归问题推广到二进制标签的分类问题。

Mean Normalization （均值归一化）

Content-based filtering(基于内容的过滤算法)VS协同过滤算法

Principal Components Analysis（PCA）（主成成分分析）

当特征太多时，几十、上百、上千个特征时，我们可以利用PCA来减少特征至2-3个，从而可以绘图分析数据。

强化学习（Reinforcement Learning ）

强化学习通过类似于奖励机制的算法，走对了加分，走错了减分，来让机器自动学习一套比较完美的行为。

回报（Return）

获得奖励的效率。获得奖励越早，回报越高。

折扣因子

获得奖励越晚，折扣因子的作用越明显。

Policy（控制器/决策）

用来决定做什么决策的算法。

Markov Decision Process（MDP）

对未来的决策只取决于当前状态而不取决于当前状态之前的任何环境；只关注你现在的状态，而不关注你是如何到达这里的。

QSA（action-value function）

用来描述当前动作价值的函数。

Bellman Equation（贝尔曼方程）

增加了控制概率（失步概率）的贝尔曼模型：

详细学习参考：吴恩达老师的机器学习课程视频。

文章标签：

算法

机器学习/深度学习

搜索推荐

数据挖掘

运维

关键词：

深度学习基础知识

深度学习基础知识扫盲

羊羊羊i

目录

相关文章

A等天晴

|

机器学习/深度学习自然语言处理算法

深度学习基础知识：介绍深度学习的发展历程、基本概念和主要应用

深度学习基础知识：介绍深度学习的发展历程、基本概念和主要应用

A等天晴

4840 0 1

羊羊羊i

|

7月前

|

机器学习/深度学习算法

深度学习基础知识扫盲（2）

Training Set/ Validation Set/ Test Set 训练集：用来训练w,b的参数。生成w,b。交叉验证集、开发集、验证集：用来选择具体的模型。生成d。测试集：要有泛化评估能力，不能参与参数生成。

羊羊羊i

170 0 0

羊羊羊i

|

7月前

|

机器学习/深度学习算法搜索推荐

深度学习基础知识扫盲(1)

监督学习（Supervised learning）计算机通过示例进行学习，它从过去的数据进行学习，并将学习结果应用到当前数据中，以预测未来事件，在这种情况下，输入和期望的输出数据都有助于预测未来事件。

羊羊羊i

182 0 0

架构师研究会

|

机器学习/深度学习人工智能数据挖掘

【人工智能】45测试深度学习基础知识的数据科学家的问题（以及解决方案）（下）

【人工智能】45测试深度学习基础知识的数据科学家的问题（以及解决方案

架构师研究会

245 0 0

架构师研究会

|

机器学习/深度学习人工智能自然语言处理

【人工智能】45测试深度学习基础知识的数据科学家的问题（以及解决方案）（上）

【人工智能】45测试深度学习基础知识的数据科学家的问题（以及解决方案）

架构师研究会

164 0 0

co63oc_

|

机器学习/深度学习 Python

使用Anaconda运行深度学习基础知识

使用Anaconda运行深度学习基础知识

co63oc_

136 0 0

使用Anaconda运行深度学习基础知识

一个处女座的程序猿

|

机器学习/深度学习人工智能自然语言处理

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

深度学习（Deep Learning, DL）或阶层学习（hierarchical learning）是机器学习的技术和研究领域之一，通过建立具有阶层结构的人工神经网络（Artifitial Neural Networks, ANNs），在计算系统中实现人工智能。由于阶层ANN能够对输入信息进行逐层提取和筛选，因此深度学习具有表征学习（representation learning）能力，可以实现端到端的监督学习和非监督学习。此外，深度学习也可参与构建强化学习（reinforcement learning）系统，形成深度强化学习。

一个处女座的程序猿

2142 0 1

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

一个处女座的程序猿

|

机器学习/深度学习算法程序员

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

一个处女座的程序猿

353 0 0

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

一个处女座的程序猿

|

机器学习/深度学习人工智能自然语言处理

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

一个处女座的程序猿

916 0 0

DL：深度学习(神经网络)的简介、基础知识(神经元/感知机、训练策略、预测原理)、算法分类、经典案例应用之详细攻略

Echo_Wish

|

9天前

|

机器学习/深度学习传感器数据采集

深度学习在故障检测中的应用：从理论到实践

深度学习在故障检测中的应用：从理论到实践

Echo_Wish

48 5 5

热门文章

最新文章

Facebook这样看“深度学习”技术

如何从系统层面优化深度学习计算？

领域最全 | 计算机视觉算法在路面坑洼检测中的应用综述(基于2D图像/3D LiDAR/深度学习)（下）

领域最全 | 计算机视觉算法在路面坑洼检测中的应用综述(基于2D图像/3D LiDAR/深度学习)（上）

智能扑克牌识别软件（Python+YOLOv5深度学习模型+清新界面）

云栖科技评论第15期：IBM联合NVIDIA开发世界上“最快商用深度学习系统”

IBM：最新突破将大幅提升深度学习速度

基于深度学习的交通标志检测和识别（从原理到环境配置/代码运行）

深度学习caffe实践学习

深度学习学习资料

揭秘深度学习在图像识别中的核心技术与挑战

深度学习在图像识别中的应用与挑战

深度学习在图像识别中的应用与挑战

深度学习在图像识别中的应用与挑战

深度学习在图像识别中的应用与挑战

基于深度学习的图像识别技术在智能监控系统中的应用

深度学习在图像识别中的应用与挑战

基于深度学习的图像识别技术在自动驾驶系统中的应用

深度学习在图像识别中的应用与挑战

构建高效AI系统：深度学习优化技术解析

相关课程

更多

高校精品课-复旦大学-机器学习与深度学习

深度学习框架TensorFlow入门

深度学习与自动驾驶

深度学习入门与实践

深度学习原理与实践

计算机视觉入门与实践

相关电子书

更多

深度学习的最新进展

搜狗深度学习技术在广告推荐领域的应用

深度学习在电商搜索和聊天机器人中的应用

相关实验场景

更多

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

奥运时刻！零代码生成奥运风格AI写真。

【AI破次元壁合照】少年白马醉春风，函数计算一键部署AI绘画平台

云原生AI套件：五分钟微调宝可梦风格StableDiffusion

语言入门-1：环境构建

零基础入门Serverless：基于函数计算快速搭建基于人工智能的目标检测系统

下一篇

fs.oss.accessKeyId和fs.oss.accessKeySecret。