R语言-数据处理：dplyr包内 mutate-across 联用示例-阿里云开发者社区

R语言-数据处理：dplyr包内 mutate-across 联用示例

2023-06-14 1133

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： mutate和across函数是dplyr中非常常用的函数，它们可以帮助我们快速、高效地对数据进行处理和分析。本文分享了联用这两个函数处理数据的基本用法示例，熟练掌握这些函数的用法，可以大大提高我们的数据处理效率。

dplyr 是一个R语言中非常常用的数据处理软件包，它提供了一组简单、一致的函数，用于对数据框进行操作。dplyr的函数通常比R语言中的基本函数更快、更简单，而且更易于使用。其中mutate和across() 配合可用于在dplyr数据处理管道(%>%)中方便地选择多列进行相应的函数处理，从而避免了数据处理过程中管道外使用lapply或循环结构，有效保证代码的整洁统一。

mutate() 的主要功能是创建新列，而且一旦创建就可以立即在管道符使用。
across(.cols = , .fns = )函数常用的只有两个参数，.cols = 和 .fns = 分别指定选取用于遍历的列变量和处理函数。

代码示例

1、指定列向量转换向量类型

df %>% mutate(across(.cols = c(x, y, z), .fns = as.character)) #将x, y, z三列转换为字符型向量
df %>% mutate(across(.cols = 1:3, .fns = as.character) )  #改变1：3列的向量元素类型为字符型
df %>% mutate(across(.cols = everything(), .fns = as.character))   #将所有列转换为字符型向量
str(df) #查看数据框列向量类型

2、将所有字符型的列向量转换为数值型

df %>% mutate(across(where(is.character), as.numeric, .names = '{.col}.2')) ## .names 参数指定新新列名，{.col}代表旧列的列名

3、数据表中单元值的替换

df %>% mutate(across(across(everything(), ~replace(.x, .x ==  "replacement" , "parttern")))

4、使用`across()`隐函数处理列向量

注： ~是R语言隐函数[lambda]的写法,翻译为代表function(x){...}; 而 .x 或 .则是指向当前被遍历的列向量。

df %>% mutate(across(everything(),~ scale(.),.names = '{.col}.scale')) #对列向量进行中心化

df %>%  drop_na() %>%  mutate( across(where(is.numeric), log) ) #对数化

df %>% mutate(across(c(x,y), ~quantile(.,0.95,na.rm = TRUE), .names = '{.col}_quantitle') )  #计算列向量0.95分位数

df %>% mutate(across(everything(),~ .x / sum(.x, na.rm = TRUE)))  #计算列向量值百分比

5、替换某列小于0的值为NA

df %>%  mutate( across(contains("y"), ~ if_else(.x < 0, NA_real_, .x)) )

Reference

Why I love dplyr's across - Will Hipson
第 40 章 tidyverse中的across()之美1 | 数据科学中的 R 语言 (bookdown.org)

R语言-数据处理：dplyr包内 mutate-across 联用示例

1、指定列向量转换向量类型

2、将所有字符型的列向量转换为数值型

3、数据表中单元值的替换

4、使用`across()`隐函数处理列向量

5、替换某列小于0的值为NA

Reference

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

R语言-数据处理：dplyr包内 mutate-across 联用示例

1、指定列向量转换 向量类型

2、将所有字符型的列向量转换为数值型

3、数据表中单元值的替换

4、使用across()隐函数处理列向量

5、替换某列小于0的值为NA

Reference

热门文章

最新文章

相关课程

相关电子书

1、指定列向量转换向量类型

4、使用`across()`隐函数处理列向量