我想了解多一点关于R和跨这里Kaggle这真的好剧本就来了:https://www.kaggle.com/msjgriffiths/d/kaggle/sf-salaries/explore-sf-salary-data/codeR:创建一个函数列表调用
我在R A初学者,我挣扎理解所使用的海报的代码,其总结如下的一部分:
data_csv <- read_csv("../Salaries.csv", na=c("Not Provided"))
data <- data_csv
glimpse(data_csv)
non_numeric_vars <- names(data)[!sapply(data, is.numeric)]
data %>%
select(one_of(non_numeric_vars)) %>%
summarise_each(funs(unique_vars = length(unique(.))))
我不理解的选择是在上面的代码中的funs
功能。如果我读了dplyr的R文档,它说它需要一个由3个参数指定的函数列表。根据这个线程What does %>% mean in R,三个参数在哪里呢?
另外我试图找到unique_vars
的文档,但没有提出任何内容。我不确定在哪里可以阅读有关此变量的更多信息?
funs {dplyr} R Documentation Create a list of functions calls.
Description
funs provides a flexible way to generate a named list of functions for input to other functions like summarise_each.
Usage
funs(...)
funs_(dots) Arguments
dots,... A list of functions specified by: Their name, "mean" The function itself, mean A call to the function with . as a dummy parameter, mean(., na.rm = TRUE) Examples
funs(mean, "mean", mean(., na.rm = TRUE))
# Overide default names funs(m1 = mean, m2 = "mean", m3 = mean(., na.rm = TRUE))
# If you have function names in a vector, use funs_ fs <- c("min", "max") funs_(fs)
运行他的代码后,结果如下 - 不知道在哪里的unique_vars变量来自于他的结果:
## Source: local data frame [1 x 6]
##
## EmployeeName JobTitle Benefits Notes Agency Status
## (int) (int) (int) (int) (int) (int)
## 1 110811 2159 98648 1 1 3
'unique_vars'不是一个函数;它是程序员为值创建的参数名称。程序员只是获取每个分类变量的唯一值的数量。 –
@ 42,但结果不显示一行表示unique_vars的行,为什么将它命名为如果您无法在任何地方看到它? – Simon