2009-11-18 89 views
2

我正在做一个涉及“无监督分类”的研究。 基本上我有一个trainSet,我想以无监督的方式在X个类中聚类数据。想法与k-means所做的相似。非监督分类方法可用

比方说

第一步) FEATURESET是[1057x10]矩阵的计算方法,我想他们聚为88群。

第二步) 使用先前计算的类来计算如何在TESTDATA分类

问题 -Is可以与SVM或N-N办呢?还要别的吗 ? - 其他建议?

+0

你真的尝试过使用k-means吗?它似乎很适合这个问题。 – Stompchicken 2009-11-18 11:46:05

+0

嗨 实际上确实存在。 但我需要用不同的方法来做同样的事情来比较结果。 有什么建议吗? – tguclu 2009-11-19 14:52:45

+0

SVM是受监督的,而不是无人监督的,所以它不适合你想要的东西 – Davide 2009-12-06 06:00:15

回答

2

这里有很多聚类算法,网络上充斥着关于它们和样本实现的信息。一个好的起点是维基百科条目聚类分析Cluster_analysis。因为你有一个工作k-means的实现,你可以尝试其中一个变种,看看他们是否会得到更好的结果(k-means ++也许,看到你提到的SVM)。如果您想要一种完全不同的方法,请查看Kohonen地图 - 也称为自组织特征地图。如果这看起来太棘手,简单的层次聚类将很容易实现(找到最近的两个项目,合并,冲洗和重复)。

1

这听起来像是一个经典的聚类问题。 SVM或神经网络都不能直接解决这个问题。例如,您可以使用这两种方法中的任意一种来嵌入10维数据,例如dimensionality reduction,但它们不会将数据放入群集中。

除k-均值外,还有大量的聚类算法。如果你想要一个对比的方法,你可能想试试agglomerative clustering算法。我不知道你使用的是什么样的计算环境,但我非常喜欢Rthis (very) short guide on clustering