k-means

    1热度

    1回答

    Link to the MIT problem set 这里是我的想法电流 - 请点我错了:) 我相信其中:的抵抗组的目的是为了陪衬, 相比之下,对于训练集 - 证明k-means在每一轮消除错误。 要做到这一点,抵抗集显示错误在很begin- 宁,即不重新计算每个集群 是在每个集群的中心的重心,每个 点有后被分配。它只是停止,并且计算出的错误是 。 训练集,对于points-- 的初始80%使用

    2热度

    1回答

    我有一个38套公寓的数据集,并在上午,下午和晚上用电。我正尝试使用scikit-learn的k-Means实现将此数据集群化,并获得一些有趣的结果。 首先聚类结果: 这一切都非常好,并用4个簇我显然得到关联到每个公寓4个标签 - 0,1,2和3。使用KMeans方法的random_state参数,我可以修复质心随机初始化的种子,因此我始终可以得到归属于相同公寓的相同标签。 然而,由于这个特定的情况

    1热度

    1回答

    我是粒子群优化的新手。我阅读了关于基于PSO和K-means的聚类的研究论文,但是我没有找到相同的工作示例。任何形式的帮助都非常感谢。提前致谢! 我想在R中使用PSO和K-means进行文本文档聚类。我的基本思想是,首先PSO会给我聚类质心的优化值,然后我必须使用群集质心的优化值PSO作为k-均值的初始聚类质心以获得文档簇。 下面是描述我迄今为止所做的工作的代码! #Import library

    0热度

    1回答

    我有一大堆由硬件设计模拟生成的错误消息。这些消息中只有极少的语法或语言概念。没有明确定义的语法。这些消息可能包含数学表达式(在模拟中引发错误),发生错误的时间,以及随机符号(如@,:,[,],(,)(取决于设计作者感觉如何显示!)。消息中不需要空格,并且不需要空格。 我想对这组消息应用一个算法,可以将这些消息归入包含类似消息的存储桶中,以便我可以轻松识别出现的错误类型。 我读了关于使用Levens

    2热度

    1回答

    我有一个字母和不同颜色的形状的图像。我需要对它们执行kmeans聚类,然后提供两个不同的图像,一个只重新生成形状,另一个只重新生成Letter信号。 这是一个示例原始图像和我需要实现的。 Original Image Shape color regenerated 并且类似地,另一个只用白色R. 我已经成功地进行k均值聚类算法,如何访问标签和集群IDX再生预期的效果?有人可以请示例代码说明。这是代

    1热度

    2回答

    我想要做的事情的简单例子: 比方说,我有3个数据点A,B和C.我运行KMeans聚类在这个数据上,得到2个簇[(A,B),(C)]。然后我对这个数据运行MeanShift集群并获得2个集群[(A),(B,C)]。很显然,这两种聚类方法以不同的方式聚集数据。我希望能够量化这种差异。换句话说,我可以使用什么度量来确定从两种算法获得的两个群集组之间的相似性/重叠百分比?下面是可能被给予分数的范围: 10

    0热度

    2回答

    我有一个包含5列的数据框。我正在尝试为三个变量X,Y和Z聚类点,并找出kmeans聚类的损失函数。下面的代码会照顾到这一点,但是如果我使用160,000行对我的真实数据框运行此操作,它需要永远!我认为它可以做得更快。 PS:看来KMeans模块在sklearn不提供损失函数,这就是为什么我写我自己的代码。 from sklearn.cluster import KMeans import num

    0热度

    1回答

    在Tensorflow的K均值的实施例的代码, 当使用函数“tf.expand_dims”在point_expanded(插入尺寸为1到张量的形状。),centroids_expanded 在计算tf.reduce_sum之前。 为什么这些在第二个参数中有不同的索引(0,1)? import numpy as np import tensorflow as tf points_n = 200

    0热度

    2回答

    在做K意味着适合某些具有3个集群的向量时,我可以获取输入数据的标签。 KMeans.cluster_centers_返回中心的坐标,所以不应该有一些相应的向量?我怎样才能找到这些集群质心的价值?

    0热度

    1回答

    我已生成使用gensim一个巨大的语料库word2vec模型矩阵,我需要使用k以群集词汇均值聚类用于我需要: 余弦距离矩阵(到词,所以矩阵的大小的number_of_words X number_of_words) 设有矩阵(字特征,所以矩阵的大小是number_of_words X number_of_features(200)) 为特征矩阵我试图给我们ex = model.wv,我得到的对象类