2012-03-26 157 views
0

我不知道哪以下三种方法中的方法是最好的执行的一个属性的选择:使用元分类器 属性选择+ WEKA +朴素贝叶斯

  • 的滤波器方法
  • 天然

    1. 方法,直接使用属性选择类

    我使用的分类器是朴素贝叶斯。

    任何人都可以指导我找到最佳选择?

  • 回答

    0

    那么,没有单一的答案。

    1. 您可以使用决策树分类器(如装袋)并选择分类器进行分支决策的属性。当然,您可以看到树看到分支和分支所依据的属性(这些属性很重要)。

    2. 您可以使用正向选择或反向消除技术。 (a)在正向选择中,使用验证/测试集上的错误最少的单个特征。然后,使用您的功能池中包含的此功能,逐个尝试其余功能,然后再选择一个可以为您带来最小错误的功能。 (b)在反向消除中,使用所有特征并取出错误率。然后逐个消除每个功能。然后选择要从错误最大程度减少的功能池中取出一个。

    继续该过程,除非您对功能数量(停止标准)感到满意。

    1. 我个人使用ranker算法和infogain属性评估器来排序属性,然后使用2(a)或2(b)来选择属性。

    错误 - 您可以考虑均方根误差。其他人也可以做得很好。

    1

    有理论称为No free lunch。您应该在您的问题中尝试所有三项措施,以便在您的域中执行结果。