2016-09-28 150 views
2

我不能在岭回归中做置信区间。我有这个模型。岭回归的置信区间

model5 <- glmnet(train_x,train_y,family = "gaussian",alpha=0, lambda=0.01) 

当我做了预测我使用这些命令:

test_pred <- predict(model5, test_x, type = "link") 

有人知道如何做预测的置信区间?

回答

4

事实证明,glmnet不提供标准误差(因此不给你置信区间)作为解释here,还涉及在此vignette(以下节选):

这是一个非常自然的问题要求回归的标准误差 系数或其他估计量。原则上,这种标准的错误可以很容易地计算出来,例如,使用bootstrap。

但是,这个 包故意不提供它们。对此的原因是 ,标准误差对强烈偏向 估计(如由惩罚性估计方法产生)没有太大意义。处罚 估计是一种程序,可减少估计量的方差 引入大量偏差。因此,每个估计量的偏差是其均方误差的主要组成部分,而其方差可能只有一小部分。

不幸的是,在大多数 惩罚性回归中,不可能获得足够精确的偏差估计。任何基于引导程序的计算只能给出估计方差的评估。 的可靠估计值偏差仅在可用的无偏估计值为 可用时才可用,而在使用 惩罚性估计值的情况下通常不会出现这种情况。

举报 惩罚性估计的标准错误因此只告诉部分故事。它可以给 一个很高的精确度的错误印象,完全忽略了偏见​​造成的不准确。制定 置信度声明当然是错误的,这些置信度声明仅基于评估 估计方差,例如基于引导程序的置信度 区间。

围绕惩罚 估计可靠的置信区间可以使用 标准广义线性模型理论作为LM,GLM 和coxph实现低维模型的情况下获得。据我所知,构建可靠置信区间的方法在高维情况下是不可用的。

但是,如果您坚持置信区间,请检查出this后。