R 包的使用、结果的重用、如何处理大数据集 | 学习笔记

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 快速学习 R 包的使用、结果的重用、如何处理大数据集

开发者学堂课程【大数据之 R 语言速成与实战R 包的使用、结果的重用、如何处理大数据集】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/363/detail/4320


R 包的使用、结果的重用、如何处理大数据集

 

内容简介:

一、R 包的使用方法

二、结果的重用

三、R如何处理大数据集

 

一、R包的使用方法

●目前有超过7000个称为包(package)的用户贡献模块可供使用,可以从http//cran.r-proiject.org/web/packages下载。

R自带了一系列默认包(包括 basedatasetsgraphicsmethods 等等),它们提供了种类繁多的默认函数和数据集。

●包的安装和使用。

 

二、结果的重用

>head mtcars

>im (mpg~wt,data=mtcars)

Call:

lm(formula = mpg~ wt,data = mtcars)

Coefficients:

(Intercept)       wt

37.285   -5.344

>result <- lm(mpg~wt,data=mtcars)

 

三、R 如何处理大数据集

●专门的用于大数据的分析包,如 lm()是做线性拟合的函数,而 biglm()则能以内存高效的方式实现大型数据的线性模型拟合。

R与大数据处理平台的结合,如 RHadoopRHiveRHipe

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
SQL 分布式计算 大数据
Python+大数据学习笔记(一)
Python+大数据学习笔记(一)
135 0
|
大数据 Linux 网络安全
大数据开发工程师基本功修炼之史上最全Linux学习笔记(建议)
大数据开发工程师基本功修炼之史上最全Linux学习笔记(建议)
288 0
|
分布式计算 DataWorks 大数据
MaxCompute操作报错合集之pyODPS导入python包的时候报错,该怎么办
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
342 0
|
分布式计算 DataWorks Java
DataWorks产品使用合集之阿里云DataWorks专有云环境下,上传MaxCompute的UDF(用户自定义函数)的JAR包的步骤如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
233 0
|
Java 数据库连接 数据库
Java大数据开发工程师__Spring学习笔记(待更新)
Java大数据开发工程师__Spring学习笔记(待更新)
96 1
|
关系型数据库 MySQL 大数据
大数据开发工程师基本功修炼之Linux学习笔记(四)
大数据开发工程师基本功修炼之Linux学习笔记(四)
221 1
|
大数据 Linux 开发工具
大数据开发工程师基本功修炼之Linux学习笔记(三)
大数据开发工程师基本功修炼之Linux学习笔记(三)
142 0
|
大数据 Java Linux
大数据开发工程师基本功修炼之Linux学习笔记(二)
大数据开发工程师基本功修炼之Linux学习笔记(二)
177 0
|
大数据
数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第14章大数据与数据科学篇
数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第14章大数据与数据科学篇
204 0
|
Java 关系型数据库 MySQL
【大数据系列之JDBC】(二):IDEA添加MySQL驱动jar包
【大数据系列之JDBC】(二):IDEA添加MySQL驱动jar包
259 0
【大数据系列之JDBC】(二):IDEA添加MySQL驱动jar包

热门文章

最新文章