2016-04-29 103 views
1

当我使用斯坦福分析器来解析像这样的句子时: “JiríHubac的剧本是一颗宝石。” “吸收安德烈·特平的性格研究”。如何解析多语言的句子?

它会引起内部错误。

如何处理这种情况,句子是多语言?

回答

1

使用完整斯坦福CoreNLP工具包可以在这里找到:

http://stanfordnlp.github.io/CoreNLP/

我跑这个命令:

java -Xmx6g -cp "stanford-corenlp-full-2015-12-09/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse -file example.txt -outputFormat text 

它有没有问题,解析您的例句和输出可以在被发现file:example.txt.out

您能否提供您发出的命令以及尝试运行时出现的错误在这句话上?

+0

@StanfodNLPHelp我使用[link](https://github.com/dasmith/stanford-corenlp-python)中提供的Python接口,只提供了命令'code server.parse('some sentence')'内联'反向代码' – Matthew

+0

我不会使用Python封装。你可以尝试使用斯坦福CoreNLP服务器:http://stanfordnlp.github.io/CoreNLP/corenlp-server.html并使用这个Python包装:https://github.com/smilli/py-corenlp ...虽然我应该注意,如果你只是想处理很多句子,你可以只使用我在os.system()调用中提供的命令,然后处理输出......如果你使用“-outputFormat json”而不是文本,我们的工具包会输出处理过的句子的json – StanfordNLPHelp

+0

@StanfodNLPHelp这对我很有帮助。另外,如何从Stanford Parser获得二进制解析树?有没有这个参数?谢谢! – Matthew