2013-05-07 286 views
0

我使用Weka在已知二元结果的情况下使用训练数据执行逻辑回归。它表现相当好,正确地将大约80%的实例归类。我还有一个使用当前数据的数据集,其结果是未知的。当我使用当前数据和输出预测运行模型时,它会将每个实例分类为Yes或No,并提供错误和概率分布项(其中错误+概率分布= 1)。我无法理解这些结果。有人可以帮我解释我应该如何解读它们吗?我注意到,当概率分布低于0.5时,模型只猜测是。这是否意味着我应该把它看作是一个概率分布,结果是肯定的?Weka - 逻辑回归 - 解释结果

回答

1

类probabilites总是要总结为1。如果你有P(是)= 40%和P(否)= 20%和没有是唯一的类,你会丢失40%是?如果结果表明P(是)= 60%和P(否)= 40%,并且您要预测,而不是概率,那么明显的理性选择是是的,因为它具有所有选项的最高概率。这是Bayes optimal decision rule。 (感谢larsmans

在二元分类问题中,这与选择P> 50%的答案相同。

不知道那是什么让你看起来像实际的输出,它确实好像你得到的概率为P(否)

+1

+1。 FWIW,选择具有最高概率(或在二进制情况下> 1/2)的类被称为[贝叶斯最优决策规则](http://www.commsp.ee.ic.ac.uk/~vb198/compilation/node3的.html)。 – 2013-05-08 10:26:21

+0

@larsmans Thx的链接,我已经包括它:) – Sentry 2013-05-08 10:31:50

+0

谢谢你的澄清。非常感激。 – zgall1 2013-05-08 16:01:09