hierarchical-clustering

    1热度

    1回答

    我使用MySQL 是我的表名为npstable pk id | score | personid | date --------------------------------------- 435 | 4 | 33 | 2012-01-05 436 | 10 | 78 | 2012-01-21 437 | 5 | 22 | 2012-05-11 438 | 2 | 33 | 2

    5热度

    1回答

    有任何人听说过的工作方式相同,从R中的dist{stats}函数创建一个使用指定的距离度量以计算数据的行之间的距离计算出的 距离矩阵任何包或功能matrix, 但是把一个sprase矩阵作为输入? 我的data.frame(名为dataCluster)有dims:7000 X 10000,几乎99%稀疏。在常规的形式,是不是稀疏这个功能似乎并没有停止工作...... h1 <- hclust(di

    0热度

    1回答

    所以,我有一套我想对其进行聚类分析的文本。我已经采取了一切文本之间的Normalized Compression Distance,现在我已经基本建成加权边的完整的图形,看起来是这样的: text1, text2, 0.539 text2, text3, 0.675 我有巨大的困难,找出堵塞这个数据的最佳方式融入scipy的层次聚类方法。我可以将距离数据转换成类似this page的表格。我

    -1热度

    1回答

    似乎通过JavaScript进行机器学习处于起步阶段,因为几乎没有任何图书馆适合其他计算智能和可视化。 我使用figue.js库,并通过以下希望输出结果: http://www.meccanismocomplesso.org/en/dendrogramma-d3-parte1/ http://www.meccanismocomplesso.org/en/dendrogramma-d3-parte2

    -1热度

    1回答

    比方说,我们有以下数据集 set.seed(144) dat <- matrix(rnorm(100), ncol=5) 下面的函数创建列的所有可能的组合,并删除第一 (combinations <- do.call(expand.grid, rep(list(c(F, T)), ncol(dat)))[-1,]) # Var1 Var2 Var3 Var4 Var5 # 2 TRUE

    1热度

    1回答

    我有一个网站矩阵。我想开发一个UPGMA集群。我想使用R和素食图书馆。我的矩阵有不是所有变量都被测量的位置。 随着数据的相似矩阵: Variable 1;Variable 2;Variable 3;Variable 4;Variable 5 0.5849774671338231;0.7962161133598957;0.3478909861199184;0.8027122599553912;0.

    7热度

    1回答

    我试图使用SciPy的dendrogram方法根据阈值将我的数据划分为多个簇。但是,一旦我创建树状图并检索其color_list,列表中的条目少于标签。 另外,我已经尝试使用fcluster与dendrogram中标识的阈值相同;然而,这不会产生相同的结果 - 它给我一个群集而不是三个。 这是我的代码。 import pandas data = pandas.DataFrame({'total_

    0热度

    2回答

    我想根据距离使用凝聚层次聚类聚类一些(x,y)坐标,因为以前不知道聚类的数量。有没有任何图书馆支持这项任务? Iam使用Opencv库在C++中进行操作。

    -1热度

    1回答

    我正在使用MCA上的FactomineR执行分层聚类分析。所有的运行都很好。 我已经在我的MCA中放了一些补充个人。但我想知道他们将在哪些群集中。目前我只对积极的人的结果(res.hcpc $ data.clust或res.hcpc $调用$ X) 你知道它怎么可能知道在哪个所有的补充人群都是? 谢谢

    0热度

    1回答

    我有一个包含客户及其产品偏好列表的数据集。基本上,它是一个简单的CSV,带有一个名为“CUSTOMER”的列和另外5个名为“PRODUCT_WANTED_A”,“PRODUCT_WANTED_B”等的列。 我问这些客户是否有兴趣了解更多关于特定产品的信息,答案可能只是YES或NO(数据集中的1或0)。数据集可以下载here。显然,根据这5列中的YES或NO的组合,将会有许多不同兴趣的客户。 我的目