2013-03-05 590 views
12

对不起,我是WEKA新手,刚刚学习。如何阅读WEKA中的分类器混淆矩阵

在我的决策树(J48)分类输出,还有一个混淆矩阵:

a b <----- classified as 
130 8  a = functional 
15 150 b = non-functional 
  • 如何解读这个矩阵? & b有什么区别?
  • 另外,任何人都可以向我解释什么是域值?

回答

20

你看过wikipedia page on confusion matrices吗?矩阵周围的文本在它们的示例中的排列方式稍有不同(左侧的行标签而不是右侧的行标签),但是您也可以读取它们。

该行指示真实的类,该列指示分类器输出。然后,每个条目给出分类为<column><row>的实例数。在您的示例中,15个B被(分类错误)归类为As,150个Bs被正确归类为Bs,等等。

因此,所有正确分类位于左上角至右下角的对角线上。对角线上的一切都是某种不正确的分类。

+0

我正确的是,WEKA中的CM是: 第1行:'TP | FP' 第2排:'FN | TN' – 2014-01-30 10:59:57

+0

@ user75782131:我不会那样说的。如果有明确的正面和负面的课程,你的关于真正的积极等的声明只适用于2类问题。许多分类问题不是这样,但他们仍然存在混淆矩阵。 – Junuxx 2014-02-13 12:34:28

+0

对于2类问题,如果正类的索引为0,则表示第一行为TP,FN,第二行为FP,TN。 – silmeth 2015-09-24 19:33:55

7

我会这样说:

混淆矩阵是Weka的这个J48模式有多好是什么它得到正确的方面报告,以及它得到错误的。

在您的数据中,目标变量是“功能性”或“非功能性”;矩阵的右侧告诉你列“a”有效,“b”不起作用。

这些列告诉你你的模型是如何分类的样本 - 它就是模型预测:

  • 第一列包含所有这些模型认为是“一个”样本 - 145人,总
  • 第二列包含所有这些模型认为是“b”样本 - 其中有158

该行,而另一方面,代表了现实:

  • 第一行包含所有的样品,其确实是“一” - 138其中,总
  • 第二行包含所有这确实是“b”的样品 - 其中

165知道了列和行,你可以深入到细节:

  • 左上,130,有些事情你的模型自以为是“一”,这真的是 “一” < - 这是正确的
  • 左下,15 ,是的NGS模型认为是“一”,但 真的是“B” < - 一种错误的
  • 右上,8,有些事情你的模型认为是“B”,但 真的是“一” < - 另一一种错误
  • 右下,150件事情你的模型自以为是“b”,这 真的是“b”

所以左上角和矩阵的右下角都显示一些模型得到的权利。

矩阵的左下角和右上角显示您的模型混淆的地方。