2015-03-30 58 views
0

我对如何验证通过data mining algorithms生成的我们的data mining models的有用性有些困惑。对于classification,我确定我们可以将Partition数据转换为测试和训练集。我们如何确定从clustering and association生产的模型的有效性?验证数据挖掘模型的成功

+0

您也可以定义用于聚类和关联的测试集。 – axiom 2015-03-30 18:30:48

回答

0

关联规则可以用于预测,因此可以通过分割数据以相同的方式进行评估。

聚类:你会怎样使用反正呢?

“证明”群集的方式是使用结果来改善分类性能,或者通过向人类用户提供洞察。如果用户从集群中获得了洞察力,那么它就起作用了!

0

对于聚类(和关联规则),您可以使用交叉验证来验证准确性。例如,Weka提供了检查聚类准确性的工具,以便您可以调整参数(例如,聚类数量等)。检查此相关question