我有一个data.frame,其中包含用户信息,但每个用户标识可能包含或不包含重复的行,其中的一些缺失数据在不同的变量中。 我想要做的是删除重复的用户数据,但对于每个用户,我想保留行中包含最少的缺失值在行中尽可能多地保留用户的信息。以下是创建演示数据帧的代码示例。任何帮助将特别赞赏,如果它是通过“dplyr”包完成的。R保留具有至少nas的行,用于重复行
User_Table <- data.frame(User_ID =rep(c("UserA","UserB","UserC"),each=3),
VariableA= rep(c(1,NA,2),each=3),
VariableB = rep(c("TypeA","TypeB",NA),each=3),
VariableC = rep(c(NA,2,3),each=3))
User_Table[c(1,2,4,5,6,7),3] <- NA
对于USER_ID “B” 和“C “有很多情况下,行ha有最低限度的新加入。你想选择第一个案件还是所有这些行? – akrun