2012-07-18 99 views
1

我遇到了一个莫名其妙的错误。 我使用下面的函数来删除包含在任一列R应用错误 - as.matrix.data.frame()中的错误

##### removes NA'd rows from a dataFrame 
wipeNArows<-function(X){ 
    rowsToDelete<-unique(unlist(apply(apply(X,2,is.na),2,which))) 
    if (length(rowsToDelete)>0){ 
    return (X[-rowsToDelete,]) 
    } 
    else{ 
    return (X) 
    } 
} 

该功能能正常工作正常的NA观察的数据帧的行,例如一个可再现的例子是:

testFrame<-data.frame(x=rpois(20,10),y=rpois(20,10),z=rpois(20,10)) 
rowsToDelete<-sample(1:nrow(testFrame),5,FALSE) 
testFrame$x[rowsToDelete]<-NA 
testFrame 
wipeNArows(testFrame) ### removes the rows where NA is encountered 

现在我有一个包含约2993行的数据框。当我通过这个数据帧通过我面临着以下错误的函数:

Error in apply(apply(X, 2, is.na), 2, which) : 
error in evaluating the argument 'X' in selecting a method for function 'apply': Error in as.matrix.data.frame(X) : 
dims [product 14965] do not match the length of object [14974] 

感谢响应,

+1

你可以提供一个例子,它*不*工作,而不是*工作*? – A5C1D2H2I1M1N2O1R2T1 2012-07-18 06:54:52

+0

我建议在函数的开头插入'browser()'。这样,你可以遍历你的代码,检查每个元素并追踪错误。 – 2012-07-18 08:19:58

回答

4

另一种方法来解决你的问题将是na.omit

na.omit(testFrame) 

    x y z 
2 7 11 11 
3 12 10 10 
4 13 10 9 
6 11 10 12 
7 13 14 8 
8 7 9 7 
9 8 11 12 
10 5 10 7 
11 5 15 9 
12 7 13 9 
15 15 8 9 
16 13 7 15 
17 5 10 12 
18 9 8 6 
20 18 7 6 
+0

不错,这不需要重新投射 – 2012-07-18 08:21:42

8

工作正常,我,但为什么不使用?complete.cases

testFrame[complete.cases(testFrame),] 
    x y z 
2 10 8 13 
3 11 16 18 
4 11 7 7 
6 8 8 14 
7 9 11 11 
8 12 11 5 
9 10 7 4 
10 7 12 9 
11 10 13 11 
12 9 12 10 
13 10 5 8 
14 13 5 8 
15 11 5 5 
18 13 14 7 
19 2 13 8 

identical(testFrame[complete.cases(testFrame),], wipeNArows(testFrame)) 
[1] TRUE 
+0

+ 1 - 明显的做法! – mnel 2012-07-18 06:55:24

0

没有问题数据,我只能建议不同的功能

wipe_na_rows <- function(X){ 
    X[!apply(X, 1, function(x) any(is.na(x))),] 
} 
4

hmm th anks的回复, 不知道complete.cases功能。但这给了另一个错误

Error in complete.cases(dFrame) : not all arguments have the same length 

chisq.test Error Message - >似乎解决这个问题的方式。

有问题的数据框的问题是它包含一个带日期的POSIXlt对象列。明确的完成案件和适用于内部工作并没有很好地处理。解决方法是使用strftime转换为字符,然后使用strptime转换回来。

感谢,

1

一般情况下,如果你没有呐在你的数据,然后根据阿迪亚Sihag建议,该问题可能是一个data.frame列的数据类型可能是列表或POSIXlt对象等对象列表。您可以投射它们,也可以仅在列上使用乐器。但是,在应用lapply之前,再次确保您的列数据类型不是列表或POSIXlt,如果是,则只需投射它。