《R语言数据挖掘》----1.17 总结

简介:

本节书摘来自华章出版社《R语言数据挖掘》一书中的第1章,第1.17节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.17 总结

本章讨论了以下主题:

数据挖掘和可用的数据源。

R语言的简要概述以及使用R语言的必要性。

统计学和机器学习,以及它们与数据挖掘关系的描述。

两个标准的行业数据挖掘过程。

数据属性类型和数据测量方法。

数据预处理的3个重要步骤。

数据挖掘算法的可扩展性和效率,以及数据可视化的方法与必要性。

社交网络挖掘、文本挖掘和网络数据挖掘。

关于RHadoop和Map Reduce的简短介绍。

在下面的章节中,我们将学习如何使用R语言来处理数据并实现不同的数据挖掘算法。

相关文章
|
7月前
|
数据采集 机器学习/深度学习 算法
R语言数据挖掘:从“挖井”到“淘金”
R语言数据挖掘:从“挖井”到“淘金”
167 9
|
SQL 数据可视化 算法
R语言公交地铁路线进出站数据挖掘网络图可视化
R语言公交地铁路线进出站数据挖掘网络图可视化
|
算法 数据挖掘 数据库
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
|
数据可视化 数据挖掘
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(下)
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分
|
数据可视化 算法 数据挖掘
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(上)
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分