2015-03-13 353 views
2

我有以下数据集:无法计算稳健标准误(vcovHC):多重共线性和NaN的错误

share <- c(-0.16,-0.07,0,0,-0.06,-0.06,-0.18,-0.23,-0.07,-0.24,0,0,-0.22,-0.15,0,0,-0.09,-0.2,0,-0.19,0,-0.16,-0.24,-0.14,-0.22,-0.22,0,-0.18,0,0,-0.01,0,0,-0.14,0,-0.06,0,-0.12,0,0,-0.14,0,0,0,-0.02,0,0,0,0,0,-0.19,0,-0.21,-0.08,0,0,0,-0.1,-0.17,0,0,-0.13,-0.08,-0.1,0,-0.05,-0.06,0,0,-0.1,0,0,0,-0.16,0,-0.18,-0.04,-0.08,0,-0.06,0,0,0,-0.2,0,0,-0.08,0,0,-0.01,0,-0.16,-0.08,0,0,0,-0.02,-0.18,0.17,-0.2,-0.14,0,-0.24) 
grade <- c(-22.64,-2.39,-15.3,-22.34,-6.39,5.25,0.47,33.61,-0.54,-25.21,16.41,-13.94,21.04,-19.64,-7.48,-32.18,-19.48,21.65,0.88,-1.6,28.49,13.61,-1.69,19.34,2.19,-7.25,6.65,7.25,20.56,16.25,17.24,12.3,3.7,-8.64,8.25,3.27,6,14.32,0.91,8.6,-6.84,13.35,6.99,3.36,0.29,19.46,2,10.75,8.76,-6.54,36.46,28.88,0.44,4.73,3.52,-10.7,-3.88,-2.36,-15.12,9.55,-4.96,10.7,6.84,-10.98,13.03,3.46,14.65,-1.66,6.89,-11.47,-6.52,15.64,3.02,4.11,-8.41,4.77,18.97,-3.73,9.54,-6.06,13.1,-24.62,-2.5,-30.26,3.82,12.97,4,2.21,14.33,12.47,-55.11,19.86,13.7,9.19,-11.01,-2.52,13.1,3.83,1.51,4.18,-3.14,-5.85,8.39) 
treat <- c(0,0,0,0,0,0,0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0) 
dataset <- as.data.frame(cbind(share, grade, treat)) 

我想运行下面的线性模型,并通过使用sandwich包计算稳健标准误差。

library(sandwich) 
model <- lm(grade ~ treat + share + treat*share, dataset) 
robSE <- sqrt(diag(vcovHC(model, type = "HC2"))) 

线性模型的输出是正常,但稳健标准误不计算:返回对于每个标准误差NaN

我的猜测是,NaN是由于变量treatshare是几乎完全共线(只有一个观察其中treat=1share!=0)。问题是我必须使用这些变量;我无法替代他们。

有人可以想出一个解决方法来解决这个问题吗?

+0

绝对需要“HC2”吗? HC0和HC1给出了非NaN结果(顺便说一句,你可能在Cross Validated上获得更好的运气,一个比SO重点更多的统计信息) – 2015-03-13 08:58:10

+0

@DominicComtois:你是对的两次,HC1的工作和交叉验证会更好。我做了一些阅读并将使用HC1。我将张贴这样一个选择的理由来解答这个问题。非常感谢。 – tiago 2015-03-13 16:51:49

回答

2

在做了一些阅读后,@DominicComtois的建议,我想在这里我将不得不与HC1一起去。 HC3,HC4(Long和Ervin2000,Hayes和Cai2007)或HC4m(Cribari-Neto和Silva2011)会更好,但它们都给出了NaN结果。 HC0的问题在于它倾向于偏向于小到中等大的样本(Hayes和Cai 2007,Cribari-Neto和Silva 2011)。

参考文献

Cribari-Neto F.,da Silva W.B. (2011年)。线性回归模型的新异方差一致协方差矩阵估计。 Adv Stat Anal 95:129-146。

Hayes,A.F.,& Cai,L.(2007)。在OLS回归中使用异方差一致的标准误差估计量:引入和软件实现。行为研究方法,39,709-722。

Long,J.S.,Ervin,L.H.(2000)。在线性回归模型中使用异方差一致的标准误差。上午。统计。 54,217-224。