2017-01-01 82 views
-1

我想在Eclipse中使用mallet对文档(wsdl文件)进行预处理。我想要生成特征向量并使用短槌和MaxEntropy执行分类。我是新的使用槌,任何人都可以在这方面指导我。使用Mallet和MaxEntropy分类

感谢

回答

1

如果你指的是Web服务描述语言,我不知道专为那些文件的任何具体的工作流或软件包。我怀疑你可能想要创建一组功能,将文本(来自Web服务描述)和更多“类别”功能(如URL或URL模式)相结合。

我会解决这个问题的方法是创建一个单独的包,读取WSDL文件并以Mallet预期的格式写出一个文件。这个适配器可以用你最喜欢的任何语言编写。它将读取所有文件,为每个文件获取一个经过解析的XML树,提取文本和某些其他功能,并以Mallet首选的制表符分隔的单行每格格式输出一个文件。

+0

线程“main”中的异常java.lang.NoClassDefFoundError:org.apache.commons.logging.LogFactory at com.predic8.soamodel.AbstractParser.class $(AbstractParser.groovy)\t at com.predic8.soamodel.AbstractParser。 $ get $$ class $ org $ apache $ commons $ logging $ LogFactory(AbstractParser.groovy)\t at com.predic8.soamodel.AbstractParser。 (AbstractParser.groovy:25)at com.predic8.wsdl.WSDLParser。 (WSDLParser.groovy)at parsing.main(parsing.java:16) – sid

+0

感谢您的回答,现在即时通过使用Java eclipse中的membrae soa进行wsdl解析,但即时获取上述异常, – sid

+0

感谢您的回答!这种方法,现在我想用分类器来测试我的数据。我正在使用命令,但它给出了错误。线程“main”中的异常java.lang.IllegalArgumentException:从文件C:\ mallet-2.0.8 \ training2.mallet加载分类器时出现问题:cc.mallet.types.InstanceList无法转换为cc.mallet.classify.Classifier cc.mallet.classify.tui.Text2Classify.main(Text2Classify.java:79) – sid