《R语言数据挖掘:实用项目解析》——导读

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:


image

前  言

随着数据规模和种类的增长,应用数据挖掘技术从大数据中提取有效信息变得至关重要。这是因为企业认为有必要从大规模数据的实施中获得相应的投资回报。实施数据挖掘的根本性原因是要从大型数据库中发现隐藏的商机,以便利益相关者能针对未来业务做出决策。数据挖掘不仅能够帮助企业降低成本以及提高收益,还能帮助他们发现新的发展途径。

本书将介绍使用R语言(一种开源工具)进行数据挖掘的基本原理。R是一门免费的程序语言,同时也是一个提供统计计算、图形数据可视化和预测建模的软件环境,并且可以与其他工具和平台相集成。本书将结合R语言在示例数据集中的应用来阐释数据挖掘原理。

本书将阐述数据挖掘的一些主题,如数学表述、在软件环境中的实现,以及如何据此来解决商业问题。本书的设计理念是,读者可以从数据管理技术、探索性数据分析、数据可视化等内容着手学习,循序渐进,直至建立高级预测模型(如推荐系统、神经网络模型)。本书也从数据科学、分析学、统计建模以及可视化等角度对数据挖掘这一概念进行了综述。

目  录

[第1章 使用R内置数据进行数据处理
1.1 什么是数据挖掘 ](https://yq.aliyun.com/articles/117846/)
1.2 R语言引论
1.2.1 快速入门
1.2.2 数据类型、向量、数组与矩阵
1.2.3 列表管理、因子与序列
1.2.4 数据的导入与导出
1.3 数据类型转换
1.4 排序与合并数据框
1.5 索引或切分数据框
1.6 日期与时间格式化
1.7 创建新函数
1.7.1 用户自定义函数
1.7.2 内置函数
1.8 循环原理——for循环
1.9 循环原理——repeat循环
1.10 循环原理——while循环
1.11 apply原理
1.12 字符串操作
1.13 缺失值(NA)的处理
小结
[第2章 汽车数据的探索性分析
2.1 一元分析 ](https://yq.aliyun.com/articles/117913/)
2.2 二元分析
2.3 多元分析
2.4 解读分布和变换
2.4.1 正态分布
2.4.2 二项分布
2.4.3 泊松分布
2.5 解读分布
2.6 变量分段
2.7 列联表、二元统计及数据正态性检验
2.8 假设检验
2.8.1 总体均值检验
2.8.2 双样本方差检验
2.9 无参数方法
2.9.1 Wilcoxon符号秩检验
2.9.2 Mann-Whitney-Wilcoxon检验
2.9.3 Kruskal-Wallis检验
小结

相关文章
|
4月前
|
SQL 数据可视化 算法
R语言公交地铁路线进出站数据挖掘网络图可视化
R语言公交地铁路线进出站数据挖掘网络图可视化
|
4月前
|
算法 数据挖掘 数据库
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
R语言主成分PCA、决策树、boost预警模型在跨区域犯罪研究数据挖掘分析|数据分享
|
4月前
|
数据可视化 数据挖掘
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(下)
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分
|
4月前
|
数据可视化 算法 数据挖掘
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分(上)
数据分享|R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分

热门文章

最新文章