R编程之路_数据汇总

简介: R编程之路_数据汇总

一、行列求和、平均值和频度

rowSums, colSums,rowMeans, colMeans 可以简单理解为按行或列求和或求均值,table把数字或字符当成因子统计频度,都相当简单:

1.   > a <- array(rep(1:3, each=3), dim=c(3,3))

2.   > a

3.   > rowSums(a)

4.   [1] 6 6 6

5.   > colSums(a)

6.   [1] 3 6 9

7.   > table(a)

对于多维数组,rowSums,colSums, rowMeans, colMeans的使用稍为复杂点。它们的参数为:

1.   colSums (x, na.rm = FALSE, dims = 1)

2.   rowSums (x, na.rm = FALSE, dims = 1)

3.   colMeans(x, na.rm = FALSE, dims = 1)

4.   rowMeans(x, na.rm = FALSE, dims = 1)

其中dims为整数,表示哪个或哪些维数被看做行或列,对于row统计函数,dims+1及以后的维度被看做行,对于col函数,dims及以前的维度(1:dims)被看做列:

1.   > b <- array(rep(1:3, each=9), dim=c(3,3,3))

2.   > b

3.   > rowSums(b)

4.   [1] 18 18 18

5.   > rowSums(b,dims=1)

6.   [1] 18 18 18

7.   > rowSums(b,dims=2)

8.       [,1] [,2] [,3]

9.   [1,]    6    6    6

10.  [2,]    6    6    6

11.  [3,]    6    6    6

12.  > colSums(b)

13.       [,1] [,2] [,3]

14.  [1,]    3    6    9

15.  [2,]    3    6    9

16.  [3,]    3    6    9

17.  > colSums(b,dims=2)

18.  [1]  9 18 27

table可以统计数字出现的频率,也可以统计其他可以被看做因子的数据类型:

1.   > table(b)

2.   b

3.   1 2 3  

4.   9 9 9  

5.   > c <- sample(letters[1:5], 10, replace=TRUE)  

6.   > c

7.   [1] "a" "c" "b" "d" "a" "e" "d" "e" "c" "a"

8.   > table(c)

9.   c

10.  a b c d e  

11.  3 1 2 2 2  

如果参数不只一个,它们的长度应该一样,结果是不同因子组合的频度表:

1.   > a <- rep(letters[1:3], each=4)

2.   > b <- sample(LETTERS[1:3],12,replace=T)

3.   > table(a,b)

4.     b

5.   a   A B C

6.    a 0 3 1

7.    b 3 0 1

8.    c 1 1 2


相关文章
|
机器学习/深度学习 数据采集 SQL
一文读懂大数据实时计算(一)
本文分为四个章节介绍实时计算,第一节介绍实时计算出现的原因及概念;第二节介绍实时计算的应用场景;第三节介绍实时计算常见的架构;第四节是实时数仓解决方案。
2191 0
一文读懂大数据实时计算(一)
|
21天前
|
分布式计算 大数据 Hadoop
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。
291 2
数据仓库(13)大数据数仓经典最值得阅读书籍推荐
|
11月前
|
存储 移动开发 算法
《阿里大数据之路》读书笔记:第二章 日志采集
《阿里大数据之路》读书笔记:第二章 日志采集
|
12月前
|
安全 数据处理
R编程之路_数据汇总(2)
R编程之路_数据汇总(2)
|
数据采集 存储 监控
DMBOK 读书笔记系列 数据治理
数据治理的定义是在管理数据资产过程中行使权利和管控,包括计划、监控和实施。数据治理职能是指导所有其他数据管理领域的活动。
DMBOK 读书笔记系列 数据治理
|
存储 大数据 数据库
【读书笔记】《大数据之路》——维度设计总结(2)
【读书笔记】《大数据之路》——维度设计总结(2)
|
存储 大数据
【读书笔记】《大数据之路》——维度设计总结(3)
【读书笔记】《大数据之路》——维度设计总结(3)
|
存储 大数据 OLAP
【读书笔记】《大数据之路》——维度设计总结(1)
【读书笔记】《大数据之路》——维度设计总结(1)
【读书笔记】《大数据之路》——维度设计总结(1)
|
数据采集 前端开发 大数据
创业公司如何做数据分析(一)开篇
本文将按照“WHY->WHAT->HOW”的思考方式来阐述下面三个问题:创业公司为什么需要做数据分析?创业公司做数据分析,需要做哪些事情?如何实现这些数据上的需求?从而基于“数据驱动”来做决策、运营与产品。
8893 0

热门文章

最新文章