2010-05-30 174 views
2

我想了解贝叶斯网络。我有一个数据文件,它有10个属性,我想要获取这个数据表的混淆表,我想我需要计算所有字段的tp,fp,fn,tn。这是真的吗?如果这是我需要做的贝叶斯网络。贝叶斯网络的混淆矩阵

真的需要一些指导,我迷路了。

+0

我对理解这个问题有困难。你的贝叶斯网络执行什么任务?它是分类吗?如果是这样,什么是分类,它是你的数据文件中的属性之一?更多的信息会使这个问题更容易回答。 – 2010-06-02 16:29:29

回答

4

的过程通常是这样的:

  • 你必须要使用到训练 分类,以便它可以预测 类新的无标签实例的一些标记数据实例 。
  • 使用您的分类器 的选择(神经网络,bayes 网,SVM等),我们建立一个 模型与您的训练数据 作为输入。
  • 在这一点上,你通常想 部署之前评估 模型的性能。因此,使用数据 (试验组)的 以前未使用的子集,我们比较模型 分类为这些情况 针对实际的类。总结这些结果 甲 好方法是通过一个混淆矩阵表示 每个类的实例是如何 预测。

对于二元分类任务,惯例是将一个类分配为正数,另一个为负数。因此,从混淆矩阵中,被正确分类为正的正实例的百分比被称为真正(TP)速率。其他定义遵循相同的约定......

0

你所问的是一个混淆矩阵有两个以上的班。 这里是你怎么做的步骤:

  • 建立一个分类为每个类,其中的训练集由 集合类中的文件(正标签)及其 补(负标签)。
  • 给出测试文档,分别应用每个分类器。
  • 文件分配给具有最大比分, 最大置信度值或最大概率

这里类是可以有更多的信息纸参考:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.