2017-06-05 321 views
2

我对某些数据运行logit回归。我的因变量是二元的,因为它们都是我的独立变量之一。
当我跑我的回归,STATA下降很多我的自变量,并给出了错误:即使变量之间的关联不是1或-1,Stata也会抛出“预测失败完成”的变量?

"variable name" != 0 predicts failure perfectly
"variable name" dropped and "a number" obs not used

我知道一个事实,某些变量的下降并不能预测完全失败。换句话说,因变量对于自变量的值1或0可以取值1。

为什么会发生这种情况,我该如何解决?

+1

没有你的数据或一个例子发生这种情况,我们不能真正知道这里发生了什么 –

+2

作为一个猜测虽然也许你的一些变量没有数据对于所有的观测,这些观测将不会用于回归和内部在回归中的子样本变量完美地预测了失败 –

+1

您的文章很混乱。在开始“我知道”的句子中,当只有一个因变量和几个独立变量时,你写出“因变量”和“自变量”。所以我不清楚你的意思是“因变量可以取值1”还是“自变量可以取值1”,并且对于句子的其余部分也是如此。 – 2017-06-05 16:44:40

回答

2

双变量交叉表不显示问题。试试这个:

http://www.stata.com/support/faqs/statistics/completely-determined-in-logistic-regression/index.html

首先确认,这是发生了什么事[共线。 (有关数据,以模型的独立变量代替X1和X2。)

  1. 号协变量模式:

    EGEN图案=基团(X1 X2)

  2. 识别图案只有一个结果:

    Logit模型ŸX1 X2 预测p 总结p

    • p的极端将几乎0或几乎为1 标签图案如果p < 1E-7 //(在这里使用的值大于最小稍大)
    • 或在上述使用“如果p> 1 - 1E -7" 如果p是1几乎列表 X1 X2如果图案== XXXX //(这里从标签步骤中使用的值)
    • 上述标识协变量模式
  3. ,其预测的协变量模式完美的结果可能对研究人员有意义,或者由于模型中有许多变量而可能是异常的。

  4. 现在你必须摆脱的共线性:

    Logit模型ŸX1 X2如果模式〜= XXXX //(这里从标签步骤中使用的值)

    • 请注意,有共线 *您可以省略logit丢弃或丢弃另一个的变量。
  5. 改装与共线性模型中移除:

    Logit模型ŸX1

您可能会或可能不希望包括完全预测结果的协变量模式。这取决于(3)的答案。如果完全预测结果的协变量模式是有意义的,你可能需要排除从模型中,这些意见:

logit y x1 if pattern ~= XXXX 

在这里,人们将报告

协变量模式如此这般的预测结果完全 的最好模式其余的数据是... xyz

相关问题