R：分层聚类

2015-05-29 124 views -1 likes

-1

比方说，我们有以下数据集R：分层聚类

set.seed(144) 
dat <- matrix(rnorm(100), ncol=5)

下面的函数创建列的所有可能的组合，并删除第一

(combinations <- do.call(expand.grid, rep(list(c(F, T)), ncol(dat)))[-1,]) 
#  Var1 Var2 Var3 Var4 Var5 
# 2 TRUE FALSE FALSE FALSE FALSE 
# 3 FALSE TRUE FALSE FALSE FALSE 
# 4 TRUE TRUE FALSE FALSE FALSE 
# ... 
# 31 FALSE TRUE TRUE TRUE TRUE 
# 32 TRUE TRUE TRUE TRUE TRUE

最后一步是运行K均值聚类为每个列子集，这是一个简单的应用程序（我们希望在每个kmeans模型中有3个聚类）：

models <- apply(combinations, 1, function(x) kmeans(dat[,x], 3))

我的问题是如何运行的分层聚类，而不是K均值为列的每个子集。任何想法？

来源

2015-05-29 Ceyda Oksel

回答

您可以使用hclust

models <- apply(combinations, 1, function(x) hclust(dist(dat[,x]))) 
clusters <- apply(combinations, 1, function(x) cutree(hclust(dist(dat[,x])), k = 3))

来源

2015-05-29 09:48:34

辉煌，谢谢！ –

R：分层聚类

回答

相关问题