《机器学习与数据科学(基于R的统计学习方法)》——2.15 小结-阿里云开发者社区

开发者社区> 异步社区> 正文

《机器学习与数据科学(基于R的统计学习方法)》——2.15 小结

简介:
+关注继续查看

本节书摘来异步社区《机器学习与数据科学(基于R的统计学习方法)》一书中的第1章,第1.15节,作者:【美】Daniel D. Gutierrez(古铁雷斯),更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.15 小结

在本章中,我们了解了为何数据源是机器学习方程的命脉。我们介绍了许多连接原始数据并将其导入R环境中以用于机器学习算法的方法。下一步将会是“加工”这些原始数据,便于你选择的算法能够使用数据。这叫做“数据处理”,这是第3章的主题。

下面是本章主要内容的小结:

机器学习用的数据以各种形式存在,仅举几例,包括CSV、Excel和JSON。
使用各种各样的R包,你可以直接连接以SQL数据库表形式存在的数据。
来自像Twitter这样的社交媒体的数据已经成为机器学习应用流行的数据源。在R的帮助下,你可以很容易地连接Twitter作为数据源。
谷歌分析代表了另一种激动人心的机器学习数据源。
你可以非常容易地将数据从R中写到外部文件中。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
StarSpace是用于高效学习实体向量的通用神经模型
StarSpace是用于高效学习实体向量的通用神经模型,用于解决各种各样的问题: 学习单词,句子或文档级嵌入。 文本分类或任何其他标签任务。
1692 0
机器学习:数据降维特征选择和主成分分析PCA
机器学习:数据降维特征选择和主成分分析PCA
4 0
学习大数据分析需要什么基础?
顾名思义,大数据就是巨量数据,海量数据,也可以说是数量大,结构复杂,类型复杂的数据的集合。而从这些数据中获取有价值的信息的的能力,就是大数据技术。
1009 0
GO学习笔记 - 数据校验
基于asaskevich/govalidator实现Golang数据校验
585 0
学习机器学习和数据科学必看的十个资源
步入寒冬,这里有份关于机器学习和数据科学学习的必看资源总结可供学习,快来瞅瞅吧。
2769 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
8268 0
机器学习:数据特征预处理缺失值处理
机器学习:数据特征预处理缺失值处理
4 0
+关注
异步社区
异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
11942
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载