我想要每个数据框的子集排除第一列是NA或“”的行。我尝试将数据帧放入列表df
,然后在每个数据帧上使用lapply
。该代码的作品,只是我不知道如何覆盖与子集的每个数据帧。lapply在dataframes列表子集和覆盖dfs
df1 <- data.frame(v1=c(1, 2, 3, NA, NA, NA), v2=rep(1, 6))
df2 <- data.frame(v11=c(2, 3, 4, 5, NA, ""), v22=rep(1, 6))
df3 <- data.frame(v111=c(3, 4, 5, 6, 7, NA), v222=rep(1, 6))
df <- list(df1=df1, df2=df2, df3=df3)
df
$df1
# v1 v2
# 1 1 1
# 2 2 1
# 3 3 1
# 4 NA 1
# 5 NA 1
# 6 NA 1
#
# $df2
# v11 v22
# 1 2 1
# 2 3 1
# 3 4 1
# 4 5 1
# 5 <NA> 1
# 6 1
#
# $df3
# v111 v222
# 1 3 1
# 2 4 1
# 3 5 1
# 4 6 1
# 5 7 1
# 6 NA 1
lapply(names(df), function(x) df[[x]][!(is.na(df[[x]][,1]) | df[[x]][,1]==""), ])
# [[1]]
# v1 v2
# 1 1 1
# 2 2 1
# 3 3 1
#
# [[2]]
# v11 v22
# 1 2 1
# 2 3 1
# 3 4 1
# 4 5 1
#
# [[3]]
# v111 v222
# 1 3 1
# 2 4 1
# 3 5 1
# 4 6 1
# 5 7 1
最后,我想df3
,例如,如下:
df3
# v111 v222
#1 3 1
#2 4 1
#3 5 1
#4 6 1
#5 7 1
好问题。我从中学到了一些东西。 – 2014-08-28 19:49:28