2017-05-14 81 views
0

是否可以从命令行运行Weka中的StringToWordVector过滤器并获取处理后的输出文件?我想单独预处理我的数据,然后将它们反馈给Weka进行培训。所以我试图运行过滤器,得到一个输出文件,然后完成剩下的工作。我正在使用一个高端GPU虚拟机,仅使用SSH访问,所以我不能使用Weka GUI,只能使用命令行。Weka的StringToWordVector过滤器从命令行?

回答

1

this

java weka.filters.unsupervised.attribute.StringToWordVector -O -L -tokenizer "weka.core.tokenizers.WordTokenizer -delimiters \" \\r\\n\\t.,;:\\\"\\'()?!-¿¡+*&#$%\\\\/=<>[]_`@\"" -W 10000000 -b -i input-train.arff -o output-train-vector.arff -r input-test.arff -s output-test-vector.arff 
+0

谢谢,这几乎工作,但我发现在Ubuntu以下错误:“-bash:-¿¡+ *:事件未找到” –

+1

看起来像字符编码问题。只是包括相关的定界符而忽略其余部分。看看它是否有效。 –