正如你对针对数据分析DSL期待,R处理缺少/不完整的数据非常好,比如:在R中处理丢失/不完整的数据 - 是否有掩盖但不移除NAs的功能?
许多R的功能和有na.rm标志,当设置为TRUE ,除去在NAS:
>>> v = mean(c(5, NA, 6, 12, NA, 87, 9, NA, 43, 67), na.rm=T)
>>> v
(5, 6, 12, 87, 9, 43, 67)
但是如果你想前处理的NA 函数调用,你需要做的是这样的:
从矢量中删除每个“NA”:
vx = vx[!is.na(a)]
从向量删除的每个“NA”和替换它瓦特/“0”:
ifelse(is.na(vx), 0, vx)
以去除整个各行包含“NA”从数据帧:
dfx = dfx[complete.cases(dfx),]
所有这些功能永久除去“NA”或行与他们的“NA”。
有时候这并不完全符合你的想法 - 使工作流中的下一步需要数据框的'NA'删除副本,但在后续步骤中,您经常需要这些行返回(例如,为先前调用'complete cases'但该列中没有'NA'值导致缺少行的列计算列逐列统计量。
尽可能什么我要找的是明确的:蟒蛇/ numpy的有一个类,屏蔽数组,具有面具方法,它可以让你隐瞒 - 但不是remove--在函数调用期间的NA。 R中有类似的功能吗?
您到动物园的链接已损坏。 [Here](http://cran.r-project.org/web/packages/zoo/zoo.pdf)是我能找到的最新文档(.pdf警告)的链接,[Here](http:/ /cran.r-project.org/web/packages/zoo/index.html)是我认为是动物园最新总结的链接。 – deadstump 2012-11-02 14:40:12
URL中的错误复数'',因为它是'package = ...',而不是'packages = ...'。现在修好了,谢谢。 – 2012-11-02 14:50:36