2017-05-04 48 views
0

好日子,如何使用箱线图

我使用boxplot从我的数据集删除离群应用数据集上产生的去除异常值:

outliers <- boxplot(dataset, outline=FALSE); 

现在,作为异常值变量的所有信息,如何我是否将删除应用于数据集? boxplot做到了吗?

谢谢

+1

请参阅离群值通常是如何计算的:什么是异常区的数据(http://www.itl.nist.gov/div898/handbook/prc/section1/prc16.htm) –

回答

1

boxplot认为将异常存储在outliers$out值。因此,假设您dataset包含在一个名为value列值,你可以像这样删除:

dataset[!dataset$value %in% outliers$out, ] 

,或者如果dataset只有一个列:

dataset[!dataset$value %in% outliers$out, , drop = FALSE] 
0

可以利用这一点 -

x[!x %in% boxplot.stats(x)$out]