我正在使用Weka gui在数据集上训练SVM分类器(使用libSVM)。在.arff文件中的数据是使用Weka预测测试数据集中的文本数据标签?
@relation Expandtext
@attribute message string
@attribute Class {positive, negative, objective}
@data
我把它变成文字的袋字符串到字向量,运行SVM和得到一个体面的分类率。现在我有我的测试数据,我想预测他们的标签,但我不知道。再次它的报头信息是相同的,但对每个类别它标记有一个问号(?),即
'Musical awareness: Great Big Beautiful Tomorrow has an ending\u002c Now is the time does not', ?
再次我预先进行处理,字符串到字向量,类是在相同的位置作为训练数据。
我进入“分类”菜单,加载我的训练SVM模型,选择“提供的测试数据”,加载测试数据,右键单击“重新评估当前测试集上的模型”的模型,但是它给了我测试和训练不兼容的错误。我不知道为什么。
我该怎么办这个错误的方式来标记测试数据?我究竟做错了什么?