R语言中DataFrame列名作为函数参数

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: 在使用Tidyverse提供的各种函数时,我们很多时候都会直接传递DataFrame的列名作为函数参数,对对应的列进行操作。如果我们自定义的函数中需要传递列名作为函数参数,如何实现呢?

R语言中DataFrame列名作为函数参数

在使用Tidyverse提供的各种函数时,我们很多时候都会直接传递DataFrame的列名作为函数参数,对对应的列进行操作。如果我们自定义的函数中需要传递列名作为函数参数,如何实现呢?

直接传递列名会怎么样?

比如,我们自定义一个函数,用于计算指定列名的平均值

# 函数定义
col_mean <- function(data, colname) { data %>% summarise(across(colname, mean)) }
# 函数调用,这里的mpg为数据表中的列名
data <- read_csv(readr_example('mtcars.csv'))
col_mean(data, mpg)

执行结果:

可以发现,直接使用列名传递到函数中会报错,下面介绍两种解决方案:

使用{{}}语法糖

col_mean <- function(data, colname) { data %>% summarise(across({{colname}}, mean)) }

在函数体中使用{{}}将列名括起来即可。

使用enquo函数和!!语法糖

col_mean <- function(data, colname) { colname <- enquo(colname); data %>% summarise(across(!!colname, mean)) }

第二种方法是在函数体内部,先使用enquo()函数将列名转为表达式,然后在使用的时候通过!!符号进行提取即可。


目录
相关文章

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务