-1
比方说,我们有以下数据集R:分层聚类
set.seed(144)
dat <- matrix(rnorm(100), ncol=5)
下面的函数创建列的所有可能的组合,并删除第一
(combinations <- do.call(expand.grid, rep(list(c(F, T)), ncol(dat)))[-1,])
# Var1 Var2 Var3 Var4 Var5
# 2 TRUE FALSE FALSE FALSE FALSE
# 3 FALSE TRUE FALSE FALSE FALSE
# 4 TRUE TRUE FALSE FALSE FALSE
# ...
# 31 FALSE TRUE TRUE TRUE TRUE
# 32 TRUE TRUE TRUE TRUE TRUE
最后一步是运行K均值聚类为每个列子集,这是一个简单的应用程序(我们希望在每个kmeans模型中有3个聚类):
models <- apply(combinations, 1, function(x) kmeans(dat[,x], 3))
我的问题是如何运行的分层聚类,而不是K均值为列的每个子集。任何想法?
辉煌,谢谢! –