2016-02-28 68 views
3

我使用GATE NLP来处理我的文档,我想用实体名称的标签考生使用 在门有OpenNLPLingPipe 因为我读答案的形式here @Shashikant科雷回答他说命名实体识别在门使用LingPipe

如果你有一句“我的朋友张三去了沃尔玛 店”,OpenNLP确定了两个命名实体 - “张三”和 “沃尔玛”。我无法将“Joe Smith”标记为Person,将“Walmart” 标记为Organization。

,并建议使用LingPipe所以我用LingPipe在门NLP 提供喜欢这里

SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController"); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR")); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR")); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR")); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR")); 
     Corpus corpus = Factory.newCorpus("SegmenterCorpus"); 
     Document document = Factory.newDocument(handler.toString()); 
     corpus.add(document); 
     pipeline.setCorpus(corpus); 
     pipeline.execute(); 

然而,当我跑我的节目,我有线程这个异常

异常“main”gate.creole.ResourceInstantiationException: 未提供任何模型文件!在在 gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)

gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)什么用无模型文件的含义提供? 对不起,因为我问这个问题,但我对这个领域是全新的 ,我刚刚了解ANNIE,它不需要任何文件,当我用它来提取POS标记 任何帮助?

+0

'NamedEntityRecognizer'需要一个参数'model'。尝试首先在GATE Developer(GUI)中测试您的管道......但是我没有成功让LingPipe NamedEntityRecognizer运行。似乎这个插件在GATE 8.1中被破坏了。也许尝试邮件列表。 – dedek

+0

是的,它似乎是LingPipe插件是打破它是给我一个错误,即没有LingPipe存在,虽然它在门文件* _ * ....我正在阅读有关地名录使用它,我希望找到一个Java代码..... thanx @dedek –

+0

我不确定Gate插件来自哪里。它可能需要在类路径上使用LingPipe模型(在带有给定标记集的语料库上训练的命名实体识别器)。如果您可以查看gate.lingpipeNamedEntityRecognizerPR代码,它可能会指示它正在查找的路径。然后你只需要把它放在类路径中。 –

回答

2

最后它适用于我。

我试过FileReady Made ApplicationsLingPipeLingPipe IE System在GATE GUI中。它已经加载好了。

工作模型是: $gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker

完整的相关配置为gate.lingpipe.NamedEntityRecognizerPR是:

...  
<string>modelFileUrl</string> 
<gate.util.persistence.PersistenceManager-URLHolder> 
    <urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString> 
</gate.util.persistence.PersistenceManager-URLHolder> 
... 

GATE screen clip

+0

非常感谢你回来回答这个问题:)))....我会再试一次thanx :)))) –

相关问题