2

我正在研究关于葡萄酒质量的UCI数据集。我已经应用了多个分类器,而k-最近的邻居就是其中之一。我想知道是否有一种方法可以通过5倍交叉验证找到最近邻居的k的确切值。如果是的话,我该如何申请?我如何使用5倍简历来获得决策树的深度?使用交叉验证为k最近邻居分类器找到正确的k值

谢谢!

回答

0

我在这里假设你的意思是k的值,它返回葡萄酒质量模型中最低的误差。

我发现一个好的k可以取决于你的数据。稀疏数据可能偏好较低的k值,而较大的数据集可能适用于较大的k值。在我的大部分工作中,5到10之间的k对于大量情况下的问题已经很好。

试验和错误有时可能是最好的工具,但不应该花太长时间才能看到建模错误的趋势。

希望这有助于!