2014-10-30 53 views
0

我已经成功地将LibSVM API集成到mu java代码中。我需要将大型文档集合转换为数字表示并将其提供给LibSVM分类器。据我所知weka有能力将文档转换为特征向量。任何人都可以告诉我该怎么做?如何在java代码中结合weka和LibSVM

回答

1

U可以做这样的

DataSource source = new DataSource(new File("mycsvinputfile")); 
    System.out.println(source.getStructure()); 
    Instances data = source.getDataSet(); 

    // setting class attribute if the data format does not provide this information 
    // For example, the XRFF format saves the class attribute information as well 
    if (data.classIndex() == -1) 
     data.setClassIndex(data.numAttributes() - 1); 

    //initialize svm classifier 
    LibSVM svm = new LibSVM(); 
    svm.buildClassifier(data); 

不要忘了在你的项目中使用weka.jar,libsvm.jar和wlsvm.jar(在LIBSVM包装)。因此,只需在您的构建路径或课程路径中包含所有3个罐子或任何其他罐子。

+0

我们真的需要wlvsm吗?如果是的话我可以找到它吗? – 2014-10-30 17:33:18

+1

它是libsvm的包装器。所以你几乎需要它。最好 – 2014-10-31 09:44:23

+0

感谢您的更新回应 – 2014-11-01 04:15:35