2013-05-02 113 views
0

我是WEKA的新手。WEKA如何计算平方误差值或SSE的和?

我想知道如何WEKA得到他们简单的K-means算法的SSE值?

我的朋友和我实现实现K-means算法一个java,并用相同的数据集,我们的Java实现的算法得到的只有大约400 SSE价值,同时WEKA得到2000年左右怎么会这样可能吗?

我的朋友也说,WEKA使用K均值++。这可能是导致他们获得不同结果的原因之一吗?

任何想法将不胜感激。谢谢 如果有任何我说错的话,请纠正我。我很想学习。

+0

您是使用交叉验证还是仅使用列车/测试分割? – Steve 2013-05-02 18:32:50

+0

@steve你不用无监督的方法进行交叉验证。 – 2013-05-03 10:14:50

+0

@ErichSchubert以为他们以此为:-) – Steve 2013-05-03 13:18:46

回答

0

你是否规范化了你的数据?

不同正常化将使两不同的结果和不同SSE值。

也可以尝试出口的结果,然后使用相同的实现来计算两个SSE值。

+0

分类框架的一部分啊,也许这是问题,我们还没有被归我们的数据,并进行数据清洗和充塞感谢您的答复 – 2013-05-13 12:37:10