hierarchical-clustering

    0热度

    1回答

    我有大量的食物名称。我必须以某种方式进行聚类,我可以识别类似的食物。例如所有类型的比萨应该在一组中,并且所有的汉堡都在另一组中。我可以使用什么样的聚类算法。请建议我是否有其他类似的分类已经存在,并建议我可以使用它的任何工具

    1热度

    2回答

    I have a matrix x= [[0,1,1,1,0,0,0,0], [1,0,1,1,0,0,0,0], [1,1,0,1,0,0,0,0], [1,1,1,0,0,0,0,0], [0,0,0,0,0,1,1,1], [0,0,0,0,1,0,1,1], [0,0,0,0,1,1,0,1], [0,0,0,0,1,1,1,0],] 主叫AgglomerativeCl

    0热度

    1回答

    我编码我的应用程序的每个功能,所以我不使用它做家居的工具,你 一直在寻找解决方案时,把我的凝聚层次聚类 如何我是否集群?在C#中,它使用Euclidean_Distance文档对 之间计算距离 我已经编写应用程序4.5.2 到目前为止我使用标准的层次同时它采用UPGMA计算距离之间的集群,以决定合并其那些 我也编码兰德指数和F措施来测试我的手工标注数据集的成功 但问题是,当停止合并多个集群 我真的

    0热度

    3回答

    我在3维空间中有大约2000万个点(x,y,z)的大型数据集。我知道这些点是在密集区域组织的,但这些区域的大小各不相同。我认为标准的无监督3D聚类应该可以解决我的问题。由于我无法先验地估计聚类的数量,我尝试使用k的宽范围的k-means,但是速度很慢,而且我也不得不估计每个k分区有多重要。 基本上,我的问题是:我怎样才能将我的点的最重要的分区提取到集群?

    1热度

    1回答

    我正在想象一个数据集与heatmap.2函数从gplots包在R.基本上我是对原始数据执行分层聚类分析,同时强制热图显示数据的有限版本(-3和+3之间),以限制异常值对热图外观的影响,同时仍保留原始聚类。当我使用完整的数据集(fullmousedatamat)时,它工作得很好。但是,当我使用部分数据集(partialmousedatamat),并且想要使用与完整数据集相同的密钥进行绘图时,一些颜色

    0热度

    1回答

    我有混合数据类型矩阵Data_string大小(947 x 41)包含数字和分类属性。 我用Rstudio中的daisy()函数和Gower距离度量生成了一个距离矩阵(947 x 947)。 d <- daisy(Data_String, metric = "gower", stand = FALSE,type = list(symm = c("V1","V13") , asymm = c("V8

    0热度

    1回答

    据我所知,HAC在连接功能方面有几个选项。您有: 产生单联动“散乱”集群 产生紧张,球团 平均连接是那种在两个 Ward的方法之间的妥协,这是完全连锁基于更多的方差比实际距离 我想弄清楚的是,我怎么知道这些我想使用哪一个?是否有某些数据集的“零散”簇比球形簇更好?还是它更多地是我打算对聚类数据做的功能?

    2热度

    1回答

    有没有一种简单的方法来获得每个观测距离其相应的集群中心的距离? 我的任务是以下几点: 我有42个000观察,每8个变量的数据集。 我跑在SAS集群过程 proc cluster data=WORK.stndstandardized_0000 method=average pseudo noeigen outtree=WORK.tree; id POL_NUMBER; var stnd_P_M2

    0热度

    1回答

    在R包 - ClustOfVar中,存在将变量彼此集群的方法。它提供了如下的错误 - train2 = train[!duplicated(lapply(train, summary))] > tree <- hclustvar(train2[, 2:10]) Error in recodquant(X.quanti) : There are columns in X.quanti

    5热度

    1回答

    我有一个四个用户之间的相似矩阵。我想做一个凝聚聚类。代码是这样的: lena = np.matrix('1 1 0 0;1 1 0 0;0 0 1 0.2;0 0 0.2 1') X = np.reshape(lena, (-1, 1)) print("Compute structured hierarchical clustering...") st = time.time() n_c