我是新来的NLP场景,并且正在使用OpenNLP 1.5
入门。 https://opennlp.apache.org/documentation/manual/opennlp.html
(我使用命令行界面上手)自定义NER模型 - 失败
我以前已经提供的样品模型,使用不同的工具进行试验和:
我通过一些文件在这里给出的命令去最后决定创建一个定制NER型号。
我遵循上述链接给出的指示。
复制给到.train
文件样本句子(我简单地创建具有该扩展名的新文件,并粘贴内容到它):
<START:person> Pierre Vinken <END> , 61 years old , will join the board as a nonexecutive director Nov. 29 .
Mr . <START:person> Vinken <END> is chairman of Elsevier N.V. , the Dutch publishing group .
我用下面的命令来使模型:
bin/opennlp TokenNameFinderTrainer -model en-ner-person2.bin -lang en -data en-ner-person2.train -encoding UTF-8
问题是,即使该模型正在创建,它似乎不能正常工作。使用新创建的模型进行测试: bin/opennlp TokenNameFinder en-ner-person2.bin
但是,当我输入Pierre Vinken
时,它不会被识别为人。我也尝试从.txt
文件创建具有完全相同内容的模型,但也失败了。
我在做什么错?
TIA。
输入“Pierre Vinken”时会得到什么结果?你尝试过输入完整的句子吗? – NBartley
@NBartley电流输出只是“Pierre Vinken”。我想' Pierre Vinken '。 –
@NBartley我还没有试过完整的句子。当我用已有的样本模型试用Pierre Vinken时,我得到了预期的输出。 –