开发者社区> 华章计算机> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

《R语言数据挖掘:实用项目解析》——导读

简介:
+关注继续查看


image

前  言

随着数据规模和种类的增长,应用数据挖掘技术从大数据中提取有效信息变得至关重要。这是因为企业认为有必要从大规模数据的实施中获得相应的投资回报。实施数据挖掘的根本性原因是要从大型数据库中发现隐藏的商机,以便利益相关者能针对未来业务做出决策。数据挖掘不仅能够帮助企业降低成本以及提高收益,还能帮助他们发现新的发展途径。

本书将介绍使用R语言(一种开源工具)进行数据挖掘的基本原理。R是一门免费的程序语言,同时也是一个提供统计计算、图形数据可视化和预测建模的软件环境,并且可以与其他工具和平台相集成。本书将结合R语言在示例数据集中的应用来阐释数据挖掘原理。

本书将阐述数据挖掘的一些主题,如数学表述、在软件环境中的实现,以及如何据此来解决商业问题。本书的设计理念是,读者可以从数据管理技术、探索性数据分析、数据可视化等内容着手学习,循序渐进,直至建立高级预测模型(如推荐系统、神经网络模型)。本书也从数据科学、分析学、统计建模以及可视化等角度对数据挖掘这一概念进行了综述。

目  录

[第1章 使用R内置数据进行数据处理
1.1 什么是数据挖掘 ](https://yq.aliyun.com/articles/117846/)
1.2 R语言引论
1.2.1 快速入门
1.2.2 数据类型、向量、数组与矩阵
1.2.3 列表管理、因子与序列
1.2.4 数据的导入与导出
1.3 数据类型转换
1.4 排序与合并数据框
1.5 索引或切分数据框
1.6 日期与时间格式化
1.7 创建新函数
1.7.1 用户自定义函数
1.7.2 内置函数
1.8 循环原理——for循环
1.9 循环原理——repeat循环
1.10 循环原理——while循环
1.11 apply原理
1.12 字符串操作
1.13 缺失值(NA)的处理
小结
[第2章 汽车数据的探索性分析
2.1 一元分析 ](https://yq.aliyun.com/articles/117913/)
2.2 二元分析
2.3 多元分析
2.4 解读分布和变换
2.4.1 正态分布
2.4.2 二项分布
2.4.3 泊松分布
2.5 解读分布
2.6 变量分段
2.7 列联表、二元统计及数据正态性检验
2.8 假设检验
2.8.1 总体均值检验
2.8.2 双样本方差检验
2.9 无参数方法
2.9.1 Wilcoxon符号秩检验
2.9.2 Mann-Whitney-Wilcoxon检验
2.9.3 Kruskal-Wallis检验
小结

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
《R语言数据挖掘:实用项目解析》——第1章,第1.2节R语言引论
本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.2节R语言引论,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.2 R语言引论 本节将开始使用基础的R编程知识来做数据管理和数据处理,其中也会讲到一些编程技巧。
1975 0
10057
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载