2014-11-03 56 views
1

我正在尝试在荷兰文本上使用TextRank。 TextRank的实施有LanguageEnglishLanguageSpanish类,它们导入OpenNLP类,如哪里可以找到荷兰工具的opennlp.tools.lang.dutch。*包?

import opennlp.tools.lang.english.ParserTagger; 
import opennlp.tools.lang.english.SentenceDetector; 
import opennlp.tools.lang.english.Tokenizer; 

import opennlp.tools.lang.spanish.PosTagger; 
import opennlp.tools.lang.spanish.SentenceDetector; 
import opennlp.tools.lang.spanish.Tokenizer; 

我想延长TextRank荷兰,为此我已经创建了一个新的LanguageDutch类,但我找不到相应的OpenNLP类进口,如

opennlp.tools.lang.dutch.PosTagger; 
opennlp.tools.lang.dutch.SentenceDetector; 
opennlp.tools.lang.dutch.Tokenizer; 

我在哪里可以找到他们(或者还有第三第二方实现)?

或者是否有其他方法可以实现相同的目标?

回答

1

显然我正在处理的代码使用了非常旧的OpenNLP版本。切换到最新版本OpenNLP,并导入更通用的类as shown here,解决了这个问题。

+1

很高兴工作。 https://github.com/samxhuan/textrank repo来自我最初在ShareThis撰写的代码,我认为他们没有更新它。我的帐户在https://github.com/ceteri/textrank有一些分支,但有一些更新 - 尽管我已经改用Scale或Py代替以后的实现,如果这有助于https://github.com/ceteri/pytextrank / – pacoid 2017-10-01 05:20:06