《写给程序员的数据挖掘实践指南》——第1章 数据挖掘简介及本书使用方法

简介:

第1章 数据挖掘简介及本书使用方法
写给程序员的数据挖掘实践指南
假想150年前一个美国小镇的生活情形:大家都互相认识;百货店某天进了一批布料,店员注意到这批布料中某个特定毛边的样式很可能会引起Clancey夫人的高度兴趣,因为他知道Clancey夫人喜欢亮花纹样;于是他在心里记着等Clancey夫人下次光顾时将该布料拿给她看看;Chow Winkler告诉酒吧老板Wilson先生,他考虑将多余的雷明顿(Renmington)1来福枪出售;Wilson先生将这则消息告诉Bud Barclay,因为他知道Bud正在寻求一把好枪;Valquez警长及其下属知道Lee Pye是需要重点留意的对象,因为Lee Pye喜欢喝酒,并且性格暴躁、身体强壮。100年前的小镇生活都与人和人之间的联系有关。

人们知道你的喜好、健康和婚姻状况。不管是好是坏,大家得到的都是个性化的体验。那时,这种高度个性化的社区生活占据了当时世界上的大部分角落。

image

时间走过100年之后来到了20世纪60年代。个性化交互的可能性虽然有所下降但仍然存在。本地书店的店员可能会告诉某个常客“书店里上架了James Michener2的新书”,这是因为他知道该顾客喜欢James Michener的作品。或者,店员可能向顾客推荐Barry Goldwater3写的The Conscience of a Conservative,这是因为他知道该顾客是个坚定的保守派。某个常客去餐馆就餐,服务员可能会问“是不是像以往一样点餐?”

即使到今天,个性化仍然大量存在。我去Mesilla的一个本地咖啡店,咖啡店员会问我:“来一大杯加强的浓缩拿铁咖啡?”这是因为他知道这是我每天必点的品种。我将贵妇犬交给宠物美容师,她也不需要问我要修剪的样式。她知道我喜欢无修饰运动型及德式耳型。

但是从100年前的小镇开始,情况就有所改变。大型百货店和商场代替了街坊的百货店和其他商店。这种改变刚开始时,人们的选择还十分有限。Henry Ford曾经说过“只要这车是黑的,顾客就可以把车漆成任何他想要的颜色”4。唱片店出售的唱片数目是有限的,而书店出售的书也有限。想要冰激凌?只有香草味、巧克力味或者是草莓味几种。想要洗衣机?1950年时本地Sears商店5只有两种型号:一种是售价55美元的标准型,另一种是售价95美元的豪华型。

相关文章
|
5月前
|
机器学习/深度学习 人工智能 数据挖掘
【Python数据挖掘】数据挖掘简介及Jupyter notebook操作介绍(图文解释 超详细)
【Python数据挖掘】数据挖掘简介及Jupyter notebook操作介绍(图文解释 超详细)
75 0
|
算法 数据挖掘 Windows
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
147 0
|
资源调度 算法 数据挖掘
【数据挖掘】高斯混合模型 ( 模型简介 | 软聚类 | 概率作用 | 高斯分布 | 概率密度函数 | 高斯混合模型参数 | 概率密度函数 )
【数据挖掘】高斯混合模型 ( 模型简介 | 软聚类 | 概率作用 | 高斯分布 | 概率密度函数 | 高斯混合模型参数 | 概率密度函数 )
208 0
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】聚类算法 简介 ( 基于划分的聚类方法 | 基于层次的聚类方法 | 基于密度的聚类方法 | 基于方格的聚类方法 | 基于模型的聚类方法 )(二)
【数据挖掘】聚类算法 简介 ( 基于划分的聚类方法 | 基于层次的聚类方法 | 基于密度的聚类方法 | 基于方格的聚类方法 | 基于模型的聚类方法 )(二)
264 0
【数据挖掘】聚类算法 简介 ( 基于划分的聚类方法 | 基于层次的聚类方法 | 基于密度的聚类方法 | 基于方格的聚类方法 | 基于模型的聚类方法 )(二)
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】聚类算法 简介 ( 基于划分的聚类方法 | 基于层次的聚类方法 | 基于密度的聚类方法 | 基于方格的聚类方法 | 基于模型的聚类方法 )(一)
【数据挖掘】聚类算法 简介 ( 基于划分的聚类方法 | 基于层次的聚类方法 | 基于密度的聚类方法 | 基于方格的聚类方法 | 基于模型的聚类方法 )(一)
459 0
【数据挖掘】聚类算法 简介 ( 基于划分的聚类方法 | 基于层次的聚类方法 | 基于密度的聚类方法 | 基于方格的聚类方法 | 基于模型的聚类方法 )(一)
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(二)
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(二)
233 0
|
机器学习/深度学习 物联网 数据挖掘
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(一)
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(一)
692 0
|
算法 数据挖掘
【数据挖掘】决策树算法简介 ( 决策树模型 | 模型示例 | 决策树算法性能要求 | 递归创建决策树 | 树根属性选择 )(二)
【数据挖掘】决策树算法简介 ( 决策树模型 | 模型示例 | 决策树算法性能要求 | 递归创建决策树 | 树根属性选择 )(二)
606 0
【数据挖掘】决策树算法简介 ( 决策树模型 | 模型示例 | 决策树算法性能要求 | 递归创建决策树 | 树根属性选择 )(二)
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】决策树算法简介 ( 决策树模型 | 模型示例 | 决策树算法性能要求 | 递归创建决策树 | 树根属性选择 )(一)
【数据挖掘】决策树算法简介 ( 决策树模型 | 模型示例 | 决策树算法性能要求 | 递归创建决策树 | 树根属性选择 )(一)
722 0
【数据挖掘】决策树算法简介 ( 决策树模型 | 模型示例 | 决策树算法性能要求 | 递归创建决策树 | 树根属性选择 )(一)
|
机器学习/深度学习 数据采集 算法
【数据挖掘】分类任务简介 ( 分类概念 | 分类和预测 | 分类过程 | 训练集 | 测试集 | 数据预处理 | 有监督学习 )
【数据挖掘】分类任务简介 ( 分类概念 | 分类和预测 | 分类过程 | 训练集 | 测试集 | 数据预处理 | 有监督学习 )
744 0