2013-04-28 84 views
0

我可以使用聚类(例如使用k-means)在Weka中进行预测吗?在Weka中使用聚类预测

我有一些基于总统选举研究的数据。我有调查问卷(数字属性)的答案,并且我有一个属性是问题的答案您要投票谁?(1,2或3)

我使用Weka中的一些分类器(例如Bayes)进行预测。我的结果是基于这个答案(投票意向),我有大约60%的回忆(正确预测的比率)。

我知道集群是一个不同的东西,但我可以使用集群来做出预测吗?我已经试过了,但我已经意识到聚类总是选择自己的质心,并且它不使用我的投票意图问题。

回答

3

Explain results of K-means

必须是你的同事。他似乎使用相同的数据集,如果我们都可以查看数据,这将会很有帮助。

通常,聚类不是分类或预测。

但是,您可以尝试使用从群集获得的信息来改善您的分类。两个这样的技术:

  • 替代你的数据集与聚类中心,并以此为分类
  • 火车上的每个单独的分类(至少如果你的集群是相当纯WRT的类标签。!)集群,并建立一个集合(特别是,如果你的集群是不均匀的)

但我相信你对分类或聚类的理解还不够远,无法尝试这些。你需要仔细处理它们,并且很好地了解你的数据。

+0

是的,我的理解还不是很好。可以使用Weka做些简单的事情吗?有什么教程可以做我想做的事吗? – Dchris 2013-04-29 09:18:42

+0

那么,有Weka书...这是一本非常好的书,使用它! – 2013-04-29 20:10:20

+0

是这本书吗? http://www.cs.waikato.ac.nz/ml/weka/book.html – Dchris 2013-04-29 21:42:46

0

是的。您可以使用Weka界面通过群集进行预测。首先,使用预处理选项卡上传您的培训数据。然后,转到分类标签,下分类,单击选择,选择ClassificationViaClustering。 weka使用的默认聚类算法是SimpleKMean,但您可以通过点击选项字符串(即选择按钮旁边的文本)来更改,weka将显示一个消息框,单击选择并选择一组聚类算法将被列出以供选择(例如EM)。之后,您可以使用weka进行分类时,按照正常方式点击设置,进行交叉验证或上传测试数据。

希望这会帮助任何人有同样的问题!