k-means

-3热度

1回答

我有10个k表示来自数据集的群集。我想要分别建立所有这些集群的线性回归模型。即。我想要10个线性回归模型。我如何使用循环在R

0热度

1回答

我有一套我想要集群的wikipedia文本。的代码如下： import pandas as pd import numpy as np from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.cluster import KMeans #paramete

-2热度

3回答

了解K均值聚类

我正在尝试使用Matlab学习k均值聚类算法。问题是我找不到任何示例数据，它会使它更容易理解算法。但是，我在mathworks上找到了一个指定k-均值聚类的例子。但不幸的是，我无法忍受它。我试图理解这个简单的数据集，我在Stack-overflow上找到。请，我需要一个关于k-means聚类的基本示例，如果我在任何软件（即matlab）上实现它，我将确保我正确应用它。最后，例如UCI上的所有

3热度

1回答

删除多元离群值mvoutlier

问题我有在任何时间> 5个变量的组成一个数据帧，我试图做的是K均值。由于K-Means很大程度上受到异常值的影响，因此我一直试图寻找几个小时来计算和删除多变量异常值。大多数的例子都有两个变量。可能的解决方案探讨的 mvoutlier - 这里种类用户注意的是，mvoutlier可能是我所需要的。 Another Outlier Detection Method - 此处的海报注释了R函数的混合

-1热度

1回答

sklearn中的k-means簇异质性

如何计算收敛期间sklearn中的簇异质性？聚类异质性由每个采样点相对于指定聚类的欧几里德距离的总和给出。这为每一步提供了不同的价值。

1热度

1回答

我可以使用k-means来聚类非完整图吗？

我想通过使用k-means聚类算法聚类连接无向图（不是一个完整的图）。我只看到k-means用于完整的图表，但我不确定是否有另一种方式可以将它应用于非完整图形中。那么，有没有人知道这件事？而且，如果k-means不能应用于连通的无向图，那么哪种算法对聚类这种图是有好处的？在此先感谢！

0热度

1回答

Spark 2.1.0 - SparkML要求失败

我正在玩Spark 2.1.0 Kmeans - 聚类算法。 public class ClusteringTest { public static void main(String[] args) { SparkSession session = SparkSession.builder() .appName("Clustering Test")

1热度

1回答

访问由KMeans群集分组的数据的有效方式

我试图围绕每个质心绘制圆，并将半径延伸到属于每个群集的最远点。现在我的圆圈半径从聚类中心这里延伸到一点，在整个训练数据集最远的绘制是我的代码： def KMeansModel(n): pca = PCA(n_components=2) reduced_train_data = pca.fit_transform(train_data) KM = KMeans(n_c

0热度

1回答

如何上传ShinyApp中的文本文件夹以获取R中文件语料库中的文档术语矩阵？

我想从我的系统上传文件夹Shiny App以得到Corpus的Document Term Matrix以应用K-means。我尝试了各种方法来做到这一点，但我无法建立所有上传文件之间建立连接以创建语料库。我能够通过在全球环境中创建语料库来应用K-means，但是我想通过ShinyApp上传文件夹或选择多个文件来完成此操作。下面是我做了什么至今代码：我可以上传多个文件 library(shin

0热度

1回答

如何在kmeans中映射Spark中的MongoDB数据？

我想在Spark中使用MongoDB提供的数据运行k-means。我有一个工作实施例中，其作用对一个平面文件： sc = SparkContext(appName="KMeansExample") # SparkContext data = sc.textFile("/home/mhoeller/kmeans_data.txt") parsedData = data.map(lambda l