我使用GATE NLP
来处理我的文档,我想用实体名称的标签考生使用 在门有OpenNLP
和LingPipe
因为我读答案的形式here @Shashikant科雷回答他说命名实体识别在门使用LingPipe
如果你有一句“我的朋友张三去了沃尔玛 店”,OpenNLP确定了两个命名实体 - “张三”和 “沃尔玛”。我无法将“Joe Smith”标记为Person,将“Walmart” 标记为Organization。
,并建议使用LingPipe
所以我用LingPipe在门NLP 提供喜欢这里
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
Corpus corpus = Factory.newCorpus("SegmenterCorpus");
Document document = Factory.newDocument(handler.toString());
corpus.add(document);
pipeline.setCorpus(corpus);
pipeline.execute();
然而,当我跑我的节目,我有线程这个异常
异常“main”gate.creole.ResourceInstantiationException: 未提供任何模型文件!在在 gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)
gate.lingpipe.NamedEntityRecognizerPR.init(NamedEntityRecognizerPR.java:55)什么用无模型文件的含义提供? 对不起,因为我问这个问题,但我对这个领域是全新的 ,我刚刚了解ANNIE,它不需要任何文件,当我用它来提取POS标记 任何帮助?
'NamedEntityRecognizer'需要一个参数'model'。尝试首先在GATE Developer(GUI)中测试您的管道......但是我没有成功让LingPipe NamedEntityRecognizer运行。似乎这个插件在GATE 8.1中被破坏了。也许尝试邮件列表。 – dedek
是的,它似乎是LingPipe插件是打破它是给我一个错误,即没有LingPipe存在,虽然它在门文件* _ * ....我正在阅读有关地名录使用它,我希望找到一个Java代码..... thanx @dedek –
我不确定Gate插件来自哪里。它可能需要在类路径上使用LingPipe模型(在带有给定标记集的语料库上训练的命名实体识别器)。如果您可以查看gate.lingpipeNamedEntityRecognizerPR代码,它可能会指示它正在查找的路径。然后你只需要把它放在类路径中。 –