2017-03-15 30 views
0

。 如果我将训练集分成n个部分,那么对每个部分运行knn算法(k = 1)。之后,我比较每个部分的结果。它会给我一样的结果,就像我在整个训练集中运行1-nn一样吗? 例如: N = 4分频训练上4份训练集的集成4份 运行1-NN算法后,我已经从第2部分从第3部分得到的A点从第1部分,B点,C和D部分。然后,我可以比较从T到A,B,C和D的距离,以确定T属于哪个类别?k个最近邻中给定一个训练集和测试点T,需要被分类多线程程序

回答

0

我希望我理解这个问题......

如果要归类只考虑最近的点(1-NN),这将是确定。

但是,为了进行ķ -NN分类,考虑每个ķ组的最近点是不一样考虑ķ最近点,除非它们恰巧在不同的组。你至少应该保持ķ点,每个ñ组,然后挑选择的ñ* K之间最近的ķ点。

+0

对不起,这个问题可能不够清楚。它总是1-nn。这是关于在训练集的4个非重叠部分上运行1-nn,然后比较4个局部最近邻居以挑选出1个全球最近的邻居是否正确。 – gunner308

+0

好了,这是好的,因为到最后你得到设置,如果你通过他们在一个批次 – rrobby86

+0

我认为还有反复训练的“最佳”点。但是,我的多线程机器学习程序在使用1个线程运行整个训练集时表现出最高的准确性。随着我增加正在运行的线程的数量(每个线程运行在训练集的不同部分上),准确度会降低。这就是我开始怀疑自己的原因。 – gunner308

相关问题