2014-11-04 79 views
0

我一直在使用Weka GUI(3.7.11中的资源管理器)来训练某些模型。然后,通过右键单击结果窗格中的模型来保存训练好的模型。我编写了一些简单的Java代码,可以加载保存的模型并使用它来分类新实例。这一切都很好。序列化Weka过滤器

当然,我想在训练模型之前对我的数据进行一些预处理。一些预处理步骤学习值。例如,缺失值过滤器从训练数据中学习每个特征的均值或模式。因此,我想保存已学习的过滤器,就像保存学习过的模型一样,这样我就可以将过滤器和模型应用到训练模型时不可用的新实例。

我似乎无法找到任何序列化过滤器的方法。这可以做到吗?如果没有,对于简单的解决方法有什么建议?

回答

0

从马克·霍尔的Weka的邮件列表:

http://list.waikato.ac.nz/pipermail/wekalist/2014-November/062329.html

基本上,你选择了“筛选分类”中的“元分类”类别为您的分类。然后选择你想要的分类器作为它使用的分类器。然后选择“多过滤器”元过滤器并在分类器之前应用任何一系列过滤器。结果看起来似乎是可以保存的单个分类器,但实际上是分类器后面的一系列过滤器。