basic concept| 学习笔记

简介: 快速学习 basic concept。

开发者学堂课程【高校精品课-北京理工大学-数据仓库与数据挖掘(上):basic concept】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/921/detail/15641


basic concept

 

在决策数这一章中,我们将向大家介绍决策树的基本概念、hunt 算法、评估、属性测试条件的方法、过拟合以及树的剪枝。

我们首先来看一下决策树。决策树分类方法是通过给定的训练集构建一棵决策树分类模型,然后利用决策树分类模型,对未标记的数据进行分类。

image.png

对于决策树分类模型,大家可以看一下我们的 PPT。它是一种由多个节点和有向边组成的树状网络结构。在决策树模型中,它的节点主要有三类,最上面的这个节点,我们把它称之为叫做根结点,它没有入编,只有两条或多条出边。其次黄色节点把它称之为叫做中间节点。对于中间节点,它有一条路边,有两条或多条出边。这一类节点就是蓝色代表的节点,我们把它称之为叫做叶子节点。对于叶子节点,它只有一条入边,没有出边。

在决策树模型中,我们把叶子节点又称之为叫做终结节点。其余的根节点和中间节点称之为非终结节点。在决策树模型中,非中间节点它代表的是属性测试条件。

根据属性测试条件,我们可以把落入到这个节点上的数据集划分为两个或多个子集。而我们的叶子节点代表的是类的数值 no 或者 yes,它的含义是录入到叶子节点上的所有数据对象的类别等于叶子节点的值。一旦我们的决策树模型构建好了,我们就可以对我们未标记的数据对象进行检测。

image.png

比如我们这里举一个例子,我们给出了一个未标记数据对象,根据我们的决策树模型,首先从根节点开始检测,根节点的属性是 home owner,我们根据我们的被标记数据对象 home owner 的取值 no 选择一个合适的分支,沿着这个分支,我们的未标记数据对象落入到下一个节点,下一个节点是中间节点,我们可以根据这个中间节点所代表的属性测试条件,继续对我们的未标记数据进行检测。对于我们这个节点,它的属性是 mary status,也就是婚姻状态。再根据我们对标的属性对象的婚姻状态取值,Mary 的又可以选择一个合适的分支落入到下一个节点。

此时我们录入的节点是一个叶子结点,其值为 no,它的含义是代表落入到这个节点上的所有数据对象的被标签是 no,所以我们最后得到这个未标记数据对象的类别就为  no。

目录
打赏
0
0
0
0
216
分享
相关文章
【Shell 命令集合 系统设置 】Linux 初始化系统设置setup命令 使用指南
【Shell 命令集合 系统设置 】Linux 初始化系统设置setup命令 使用指南
199 0
错误记录:调用原生TvSettings 的 com.android.tv.settings.device.storage.ResetActivity 无法启动
本文记录了一个Android TV设置中由于未设置`android:exported="true"`导致`com.android.tv.settings.device.storage.ResetActivity`无法被第三方app启动的错误,并通过添加该属性成功解决了问题。
163 1
如果让你设计一个接口,你会考虑哪些问题?
接口设计需关注参数校验、扩展性、幂等性、日志、线程池隔离、异常重试、异步处理、查询优化、限流、安全性、锁粒度和避免长事务。入参与返回值校验确保数据正确性;考虑接口扩展性以适应不同业务需求;幂等设计防止重复操作;关键接口打印日志辅助问题排查;核心接口使用线程池隔离确保稳定性;异常处理中可采用重试机制,注意超时控制;适合异步的场景如用户注册后的通知;并行查询提升性能;限流保护接口,防止过载;配置黑白名单保障安全;适当控制锁粒度提高并发性能;避免长事务影响系统响应。
283 2
DistilQwen2 蒸馏小模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
本文详细介绍在 PAI 平台使用 DistilQwen2 蒸馏小模型的全链路最佳实践。
如何在 Ubuntu 20.04 上安装和使用 Docker Compose
如何在 Ubuntu 20.04 上安装和使用 Docker Compose
641 0
git 如何删除本地和远程分支
git 如何删除本地和远程分支
1173 0
Spring AOP中是如何注册Advisor的?
Spring AOP中是如何注册Advisor的?
272 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问