《R语言数据挖掘:实用项目解析》——小结

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介:

本节书摘来自华章计算机《R语言数据挖掘:实用项目解析》一书中的第2章,小结,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),译 黄芸,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

小结

探索性数据分析几乎是所有类型的数据挖掘项目都要执行的一项重要操作。解读分布、分布的形状和分布的重要参数是相当重要的。提前的假设检验可帮助我们更好地理解数据。不仅是分布及其性质,不同变量之间的关系也很重要。所以本章介绍了不同变量之间的二元和多元关系以及如何理解这些关系。诸如t检验、F检验、z检验和无参数检验等经典统计检验都是检验假设的重要方法。检验假设本身对于从数据集中得出结论和洞见也很重要。

本章我们介绍了多种统计检验和它们的用法、说明以及可以使用这些检验的场景。在实施探索性数据分析之后,下一章将介绍一些数据可视化方法来使读者对数据有个全方位的了解。有时,图形化的描述是最简单的数据展示方法。下一章将使用不同库中的一些内置数据集来创建直观的可视化。

相关文章
|
6月前
|
SQL 数据可视化 算法
R语言公交地铁路线进出站数据挖掘网络图可视化
R语言公交地铁路线进出站数据挖掘网络图可视化
|
6月前
|
算法 数据挖掘 数据库
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
|
6月前
|
数据可视化 数据挖掘
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(下)
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分
|
6月前
|
数据可视化 算法 数据挖掘
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(上)
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分

热门文章

最新文章