开发者学堂课程【大数据之 R 语言速成与实战:R 包的使用、结果的重用、如何处理大数据集】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/363/detail/4320
R 包的使用、结果的重用、如何处理大数据集
内容简介:
一、R 包的使用方法
二、结果的重用
三、R如何处理大数据集
一、R包的使用方法
●目前有超过7000个称为包(package)的用户贡献模块可供使用,可以从http∶//cran.r-proiject.org/web/packages下载。
● R自带了一系列默认包(包括 base、datasets、graphics、methods 等等),它们提供了种类繁多的默认函数和数据集。
●包的安装和使用。
二、结果的重用
>head mtcars
>im (mpg~wt,data=mtcars)
Call:
lm(formula = mpg~ wt,data = mtcars)
Coefficients:
(Intercept) wt
37.285 -5.344
>result <- lm(mpg~wt,data=mtcars)
三、R 如何处理大数据集
●专门的用于大数据的分析包,如 lm()是做线性拟合的函数,而 biglm()则能以内存高效的方式实现大型数据的线性模型拟合。
●R与大数据处理平台的结合,如 RHadoop、RHive、RHipe。