2011-04-19 70 views
2

目前我正在试图了解人工智能(学习)的话题和需要帮助了解以下内容:留一出交叉验证查询

为什么会留一出交叉验证算法与大多数分类器结合使用时,在相同数量的正数和负数示例的数据集上得分为零而不是50%?

感谢您对此提供指导。

回答

2

如果我正确地理解了这个问题,当你忽略了正面样本,训练集有更多的负面样本;因此剩下的样本被分类为负值。反之亦然。

+0

谢谢不要这样,一旦一个阳性样本被遗漏,它会被分类为阴性(因此现在101阴性99阳性),然后当另一个阳性被遗漏时,它也被分类为阴性现在是102个负数,98个是正数),依此类推,直到一切都被归类为负数,因此总是返回零? – Roy 2011-04-19 15:27:06

+1

在一次性交叉验证中,您将对所有数据(除了一个随机选择的样本)之外的分类器进行训练,然后对该样本进行测试。你重复几次。当你有相同数量的正面和负面样品时,无论你取出哪种样品,它都将被归类为另一种样品,因为另一种样品将占测试样品的一半以上。 – 2011-04-20 03:24:17