knn

    0热度

    1回答

    我正在使用scikit-learn的KNN回归器来将模型拟合到一个大型数据集中,其编号为n_neighbors = 100-500。考虑到数据的性质,一些部分(想象:峰值等尖锐的delta函数)更适合于较少的邻居(n_neighbors ~ 20-50),以便峰值不会被平滑掉。这些峰的位置是已知的(或可以测量)。 有没有办法改变n_neighbors参数? 我可以安装两个模型并将它们缝合在一起,但

    1热度

    1回答

    所以目前我有以下几点,它通过从我的具有计算距离的“距离”数组中获取最小距离值来找到最短/最近邻居。然后它会进行另一次搜索来追踪它的索引,然后向我指明它属于哪个病人。 但是,说我想找到3个最近的邻居,我该怎么做?我是否需要完全改变我的代码以适应此? 非常感谢 int min = 99; int d = 1; String diagnosis; //Finding sm

    4热度

    1回答

    我试图使用SciKit-Learn来执行我的第一个KNN分类器。我一直在关注用户指南和其他在线示例,但有几件事我不确定。对于这篇文章,您使用以下 X =数据 Y =目标 1)在大多数的介绍,我读过它似乎在说你想要一个训练集,验证集机器学习的网页,和一套测试装置。根据我的理解,交叉验证允许您将训练和验证集合在一起以训练模型,然后您应该在测试集上对其进行测试以获得分数。但是,我在论文中看到,在很多情况

    1热度

    1回答

    我有大约1M的二进制numpy数组,我需要让汉明之间的距离找到de k-nearest-neighbors,我得到的最快速的方法是使用cdist,返回一个具有距离的浮点矩阵。 因为我没有足够的内存来获得1Mx1M浮点数矩阵所以我做在这样的时候一个元素: from scipy.spatial Import distance Hamming_Distance = distance.cdist(arr

    1热度

    1回答

    我有一个多分类问题,我试图运行KNN算法来查找每个数据点周围50个最近的邻居。我在R中使用了FNN软件包,但是由于我的数据集有大约2900万行,所以需要很长时间。我想知道R中是否有可以并行运行KNN的软件包。你有什么建议与它的用途的例子?

    0热度

    1回答

    我正在使用python中的KNN算法,并尝试用MinMaxScaler标准化我的数据帧,以在0到1之间的范围内转换数据。 但是,当我返回输出,我观察到一些列最小/最大输出超过1。我错误地使用它? 下面是我返回的最小值/最大值的一个片段: 代码中使用是: kdd_data_10percent = pandas.read_csv("data/kdd_10pc", header=None, names

    0热度

    2回答

    我是机器学习的新手,我试图在KDD Cup 1999数据集上做KNN算法。我设法创建了分类器并预测了数据集,其准确率大约为92%。 但我观察到我的准确性可能不准确,因为测试和训练数据集是静态设置的,并且可能因不同的数据集集而异。 那么我该如何做N交叉验证? 下面是我的代码至今: import pandas from time import time from sklearn.neighbors

    3热度

    1回答

    我想找到边界决策函数来分类我的数据。这是他们的一个例子。 "Distance","Dihedral","Categ" 4.083,82.267,C 4.132,87.073,C 4.713,-80.999,C 3.427,-48.144,NC 3.663,96.994,C 3.99,71.919,C 3.484,78.684,C

    -1热度

    1回答

    我需要实现KNN算法来分类数据。 我有一个测试矩阵(200 * 25)和一个火车矩阵(800 * 25)。 我需要找到kNN和它的精度matlab k = 1,3,5。 这是到目前为止我的代码,但我不知道: clc clear all close all train=load('Train.txt'); [rtrain,ctrain]=size(train); xtrain=zeros

    0热度

    1回答

    我有一个程序,可以在已知的数据集上完美地工作,如乳腺癌威斯康星州的数据。我创建了一个新的数据集,其中包含100个城市当前的空气压力和股票价格的未来走势。所以大约100个维度加上-1或1的分类器。大约有350个数据实例。该算法显示大约80%的准确度。 我的问题是,当我输入旧数据进行预测时,它只能预测1,而不是-1。当训练数据包含-1分类器时,情况更是如此。任何想法都非常感谢!