R编程之路_数据汇总

简介: R编程之路_数据汇总

一、行列求和、平均值和频度

rowSums, colSums,rowMeans, colMeans 可以简单理解为按行或列求和或求均值,table把数字或字符当成因子统计频度,都相当简单:

1.   > a <- array(rep(1:3, each=3), dim=c(3,3))

2.   > a

3.   > rowSums(a)

4.   [1] 6 6 6

5.   > colSums(a)

6.   [1] 3 6 9

7.   > table(a)

对于多维数组,rowSums,colSums, rowMeans, colMeans的使用稍为复杂点。它们的参数为:

1.   colSums (x, na.rm = FALSE, dims = 1)

2.   rowSums (x, na.rm = FALSE, dims = 1)

3.   colMeans(x, na.rm = FALSE, dims = 1)

4.   rowMeans(x, na.rm = FALSE, dims = 1)

其中dims为整数,表示哪个或哪些维数被看做行或列,对于row统计函数,dims+1及以后的维度被看做行,对于col函数,dims及以前的维度(1:dims)被看做列:

1.   > b <- array(rep(1:3, each=9), dim=c(3,3,3))

2.   > b

3.   > rowSums(b)

4.   [1] 18 18 18

5.   > rowSums(b,dims=1)

6.   [1] 18 18 18

7.   > rowSums(b,dims=2)

8.       [,1] [,2] [,3]

9.   [1,]    6    6    6

10.  [2,]    6    6    6

11.  [3,]    6    6    6

12.  > colSums(b)

13.       [,1] [,2] [,3]

14.  [1,]    3    6    9

15.  [2,]    3    6    9

16.  [3,]    3    6    9

17.  > colSums(b,dims=2)

18.  [1]  9 18 27

table可以统计数字出现的频率,也可以统计其他可以被看做因子的数据类型:

1.   > table(b)

2.   b

3.   1 2 3  

4.   9 9 9  

5.   > c <- sample(letters[1:5], 10, replace=TRUE)  

6.   > c

7.   [1] "a" "c" "b" "d" "a" "e" "d" "e" "c" "a"

8.   > table(c)

9.   c

10.  a b c d e  

11.  3 1 2 2 2  

如果参数不只一个,它们的长度应该一样,结果是不同因子组合的频度表:

1.   > a <- rep(letters[1:3], each=4)

2.   > b <- sample(LETTERS[1:3],12,replace=T)

3.   > table(a,b)

4.     b

5.   a   A B C

6.    a 0 3 1

7.    b 3 0 1

8.    c 1 1 2


相关文章
|
存储 C# C语言
浮点数在计算机中存储方式
浮点数在计算机中存储方式
864 0
|
算法 Java 调度
|
数据可视化 数据挖掘 开发者
import有什么用,python中怎么使用import
import有什么用,python中怎么使用import
2206 1
|
数据可视化 搜索推荐 关系型数据库
【最佳实践】实时计算Flink在IoT行业的实时数仓建设实践
据 IDC 估计,到 2020 年物联网将在全球范围内产生 1.46 万亿美元的价值。据预测,届时中国的物联网市场规模将超过 1.8 万亿人民币。
|
5月前
|
弹性计算
阿里云ECS云服务器8核16G配置收费价格,多种ECS实例CPU及费用清单
阿里云8核16G云服务器价格因实例类型而异。计算型c9i约743元/月,一年6450元(7折);通用算力型u1仅673元/月,一年4225元(5.1折)。实际价格享时长折扣,详情见ECS官网。
|
6月前
|
JSON Dubbo 网络协议
1.Dubbo(缺省默认)
Dubbo缺省协议采用单一长连接和NIO异步通信,适合小数据量高并发场景,消费者多于提供者。不适用于大数据传输,如文件或视频,除非请求量低。支持多种传输器、序列化方式和线程池策略。特性包括基于Mina和Hessian的交互、单连接、长连接、TCP传输、NIO异步、Hessian序列化等。适用于常规远程服务调用,但参数和返回值需实现Serializable接口,不能自定义集合类。配置灵活,支持多端口和连接数控制,保障服务提供者的稳定性。
1.Dubbo(缺省默认)
|
8月前
|
人工智能 安全 算法
长擎安全操作系统:构筑企业级服务器安全的坚固基石
长擎安全操作系统,以自主可控内核为基础,构建七层纵深防御体系,全面支持国密算法与可信计算,适配能源、金融、制造等关键行业,为企业服务器提供全方位安全保障,助力数字化转型安全发展。
|
SQL 存储 关系型数据库
【MySQL 数据库】1、MySQL 的 DDL、DML、DQL 语句
【MySQL 数据库】1、MySQL 的 DDL、DML、DQL 语句
646 0
|
存储 监控 容灾
容灾备份的具体操作步骤
【10月更文挑战第28天】容灾备份是指为了防止因自然灾害、人为破坏、系统故障等原因导致数据丢失或业务中断,而提前采取的一系列数据备份和恢复措施。
|
存储 文字识别 搜索推荐
OCR是什么
【6月更文挑战第19天】OCR是什么
2038 4

热门文章

最新文章