R语言中DataFrame列名作为函数参数
在使用Tidyverse提供的各种函数时,我们很多时候都会直接传递DataFrame的列名作为函数参数,对对应的列进行操作。如果我们自定义的函数中需要传递列名作为函数参数,如何实现呢?
直接传递列名会怎么样?
比如,我们自定义一个函数,用于计算指定列名的平均值
# 函数定义 col_mean <- function(data, colname) { data %>% summarise(across(colname, mean)) } # 函数调用,这里的mpg为数据表中的列名 data <- read_csv(readr_example('mtcars.csv')) col_mean(data, mpg)
执行结果:
可以发现,直接使用列名传递到函数中会报错,下面介绍两种解决方案:
使用{{}}语法糖
col_mean <- function(data, colname) { data %>% summarise(across({{colname}}, mean)) }
在函数体中使用{{}}将列名括起来即可。
使用enquo函数和!!语法糖
col_mean <- function(data, colname) { colname <- enquo(colname); data %>% summarise(across(!!colname, mean)) }
第二种方法是在函数体内部,先使用enquo()
函数将列名转为表达式,然后在使用的时候通过!!符号进行提取即可。