1
假设我有多维数据集,其中有许多向量作为数据。我正在写一个算法,它需要做所有那些向量的k近邻搜索 - 经典KNN。然而,在我的算法中,我向整个数据集中添加了新的向量,并且需要将这些新的向量包含到我的KNN搜索中。我想要有效地做到这一点。我研究了scikit-learn的KD树和球树,但他们不允许插入(根据概念的性质)。我不确定SR树或R树是否会提供插入,但在任何情况下,我都无法找到3D以外的数据的Python实现。允许插入的高效KNN实现
关于搜索我很满意查询“给我最接近的向量”(所以1-NN)或“给我所有更接近半径的向量”。
这在[交叉验证](https://stats.stackexchange.com/)可能比这里更好。 – Antimony
@Antimony:有太多stackexchange网站的机器学习... – Make42
不完全。这是唯一的一个。 – Antimony