在需求预测项目的范围中,我想确定将时间序列彼此具有相似性的最佳方法,以便我可以应用Top Down预测算法。目前,我的关键问题是确定什么是适当的团体,以及这些团体的适当层次。在做了一些阅读后,我相信Dynamic Time Warping可能会有所帮助。为了测试这个,我创建了一个小测试用例,但是我面临着一个问题,那就是我如何在例如文本树或类似的东西中提取层次结构。我希望你们中的一个能够进一步帮助我。从R中的hclust中提取文本中的树结构
我已经创建了以下案例来演示我所得到的结果。
sc2 <- read.table("http://dl.dropbox.com/u/9641130/R/hclust.data", header=F, sep="")
SampleLabels <- c("ID1", "ID2", "ID3", "ID4", "ID5", "ID6", "ID7", "ID8", "ID9", "ID10", "ID11", "ID12", "ID13", "ID14", "ID15")
distMatrix2 <- dist(sc2, method="DTW")
hc2 <- hclust(distMatrix2, method="average")
# show the visual tree
plot(hc2, labels=SampleLabels)
不知何故,我想在文本中获取群集的名称和成员,以便我可以继续使用它。任何人有个想法?
谢谢!
据我了解,你需要选择要砍倒('numgroups')?然后用类似的方法得到分组:'groups = cutree(hc2,k = numgroups)'。这给了小组的任务。不知道你还想要什么。 – Seth