《R语言数据挖掘:实用项目解析》——2.6 变量分段

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:

本节书摘来自华章计算机《R语言数据挖掘:实用项目解析》一书中的第2章,第2.6节,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),译 黄芸,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.6 变量分段

在将连续变量纳入模型之前,需要对其进行处理。以Cars93数据集中的油箱容量为例,基于油箱容量,我们可以创建一个分类变量,值为高、中和低、低中:

image

油箱容量的值域为9.2~27。根据逻辑,使用分类差4(也即每个分类之间相差4)完成分类。这些分类定义了变量中的每一个值被分配到每一组的方式。最后的输出表显示有4个组,最高的油箱容量组只有4辆车。

变量分段或离散化不仅有助于建立决策树,在做logistic回归和其他形式的机器学习模型时也会用到。

相关文章
|
9月前
|
存储 C# 容器
C变量数据类型深度解析:打造高效代码的基石
C变量数据类型深度解析:打造高效代码的基石
53 1
|
3月前
|
SQL 存储 Oracle
南大通用GBase 8s数据库游标变量解析:提升数据库操作效率
南大通用GBase 8s 数据库游标变量解析:提升数据库操作效率
|
6月前
|
存储 Java 索引
32 位和 64 位 JVM 中 int 变量的大小解析
【8月更文挑战第21天】
295 0
|
9月前
|
存储 Java 程序员
【Python 的内存管理机制专栏】深入解析 Python 的内存管理机制:从变量到垃圾回收
【5月更文挑战第18天】Python内存管理关乎程序性能与稳定性,包括变量存储和垃圾回收。变量存储时,如`x = 10`,`x`指向内存中值的引用。垃圾回收通过引用计数自动回收无引用对象,防止内存泄漏。了解此机制可优化内存使用,避免循环引用等问题,提升程序效率和稳定性。深入学习内存管理对成为优秀Python程序员至关重要。
89 5
【Python 的内存管理机制专栏】深入解析 Python 的内存管理机制:从变量到垃圾回收
|
8月前
|
Java
Java 基础深度解析:变量与常量的声明、赋值与初始化的权威指南
【6月更文挑战第14天】Java编程中的变量和常量是基础关键。声明变量如`int age;`,赋值与初始化可在声明时或后续代码中完成。常量用`final`修饰,如`public static final double PI = 3.14159;`,且只能赋值一次。变量命名应具描述性,常量值设定后尽量不变,注重代码的可读性和可维护性。熟练掌握这些将有助于编写高质量Java程序。
110 4
|
9月前
|
存储 Java
JAVA中的变量:深入解析与实例
JAVA中的变量:深入解析与实例
120 3
|
9月前
|
程序员 Python
Python中的变量作用域:深入解析与示例
Python中的变量作用域:深入解析与示例
120 1
|
9月前
|
存储 Java 容器
Java中的常量和变量:深入解析与应用
Java中的常量和变量:深入解析与应用
105 0
|
9月前
|
存储 程序员 C语言
C语言指针变量的深入解析与应用
C语言指针变量的深入解析与应用
102 0
|
9月前
|
存储 C语言
C语言变量的作用域和存储类型深度解析
C语言变量的作用域和存储类型深度解析
130 0

热门文章

最新文章

推荐镜像

更多