0
如何使用NA识别和替换数据框中的超范围数据?如何使用NA识别和替换数据框中的超范围数据?
我目前使用下面的代码来识别使用盒图的异常值,然后手动确定哪些异常值超出范围(例如,比例是1-4,数据点是负值)并删除它们。
>boxplot(data$scale1, data = data)
>outliers <- boxplot(cw$N, plot=FALSE)$out
>outliers
>data$scale1[data$scale1==-7.58] <- NA
我手动这样做对每一个变量,因为它们都具有不同的截止点是超出了范围,我想知道如果有一个更简单的方法来做到这一点?
感谢
您的数据是否遵循某种趋势?如果数据点遵循某种特定趋势,那么您可以拟合趋势,并将远离趋势的数据点视为异常值。 – Heikki
您可以将截断值写入数据框并将其应用于每个变量。 @ Heikki:我没有看到这种方法适合的场景 –
谢谢! @tobiasegli_te听起来像我之后,我只是不确定如何做到这一点,如果每个变量有不同的截点,你有什么建议吗? – Shep