knn

0热度

1回答

我正在使用scikit-learn的KNN回归器来将模型拟合到一个大型数据集中，其编号为n_neighbors = 100-500。考虑到数据的性质，一些部分（想象：峰值等尖锐的delta函数）更适合于较少的邻居（n_neighbors ~ 20-50），以便峰值不会被平滑掉。这些峰的位置是已知的（或可以测量）。有没有办法改变n_neighbors参数？我可以安装两个模型并将它们缝合在一起，但

1热度

1回答

在K-Nearest算法（Java）中获得最短的'K'距离

所以目前我有以下几点，它通过从我的具有计算距离的“距离”数组中获取最小距离值来找到最短/最近邻居。然后它会进行另一次搜索来追踪它的索引，然后向我指明它属于哪个病人。但是，说我想找到3个最近的邻居，我该怎么做？我是否需要完全改变我的代码以适应此？非常感谢 int min = 99; int d = 1; String diagnosis; //Finding sm

4热度

1回答

Scikit-learn中KNN分类器中的网格搜索参数和交叉验证数据集

我试图使用SciKit-Learn来执行我的第一个KNN分类器。我一直在关注用户指南和其他在线示例，但有几件事我不确定。对于这篇文章，您使用以下 X =数据 Y =目标 1）在大多数的介绍，我读过它似乎在说你想要一个训练集，验证集机器学习的网页，和一套测试装置。根据我的理解，交叉验证允许您将训练和验证集合在一起以训练模型，然后您应该在测试集上对其进行测试以获得分数。但是，我在论文中看到，在很多情况

1热度

1回答

优化海明距离Python

我有大约1M的二进制numpy数组，我需要让汉明之间的距离找到de k-nearest-neighbors，我得到的最快速的方法是使用cdist，返回一个具有距离的浮点矩阵。因为我没有足够的内存来获得1Mx1M浮点数矩阵所以我做在这样的时候一个元素： from scipy.spatial Import distance Hamming_Distance = distance.cdist(arr

1热度

1回答

我该如何运行knn算法并行使用r进行多分类

我有一个多分类问题，我试图运行KNN算法来查找每个数据点周围50个最近的邻居。我在R中使用了FNN软件包，但是由于我的数据集有大约2900万行，所以需要很长时间。我想知道R中是否有可以并行运行KNN的软件包。你有什么建议与它的用途的例子？

0热度

1回答

sklearn中的MinMax Scaler没有标准化0到1之间的列值

我正在使用python中的KNN算法，并尝试用MinMaxScaler标准化我的数据帧，以在0到1之间的范围内转换数据。但是，当我返回输出，我观察到一些列最小/最大输出超过1。我错误地使用它？下面是我返回的最小值/最大值的一个片段：代码中使用是： kdd_data_10percent = pandas.read_csv("data/kdd_10pc", header=None, names

0热度

2回答

如何在KNN python sklearn中进行N交叉验证？

我是机器学习的新手，我试图在KDD Cup 1999数据集上做KNN算法。我设法创建了分类器并预测了数据集，其准确率大约为92％。但我观察到我的准确性可能不准确，因为测试和训练数据集是静态设置的，并且可能因不同的数据集集而异。那么我该如何做N交叉验证？下面是我的代码至今： import pandas from time import time from sklearn.neighbors

3热度

1回答

使用knn分类器的边界决策

我想找到边界决策函数来分类我的数据。这是他们的一个例子。 "Distance","Dihedral","Categ" 4.083,82.267,C 4.132,87.073,C 4.713,-80.999,C 3.427,-48.144,NC 3.663,96.994,C 3.99,71.919,C 3.484,78.684,C

-1热度

1回答

查找K最近邻居

我需要实现KNN算法来分类数据。我有一个测试矩阵（200 * 25）和一个火车矩阵（800 * 25）。我需要找到kNN和它的精度matlab k = 1,3,5。这是到目前为止我的代码，但我不知道： clc clear all close all train=load('Train.txt'); [rtrain,ctrain]=size(train); xtrain=zeros

0热度

1回答

KNN只预测一个类。使用Python和sklearn

我有一个程序，可以在已知的数据集上完美地工作，如乳腺癌威斯康星州的数据。我创建了一个新的数据集，其中包含100个城市当前的空气压力和股票价格的未来走势。所以大约100个维度加上-1或1的分类器。大约有350个数据实例。该算法显示大约80％的准确度。我的问题是，当我输入旧数据进行预测时，它只能预测1，而不是-1。当训练数据包含-1分类器时，情况更是如此。任何想法都非常感谢！