2011-04-27 56 views
1

我曾尝试使用SourceForge中的OpenNLP工具1.5从文本中获取命名实体。我在OpenNLP下载中找到了JWNL文件。这是否意味着OpenNLP反过来将WordNet用于命名实体识别。 (具体来说,这是否意味着名称模型文件是使用WordNet生成的)?OpenNLP是否使用名为实体识别引擎盖下的WordNet

回答

2

不,OpenNLP只使用WordNet作为共同参考解决方案,例如在单独的句子中将“He”关联到“Steve Jones”。

WordNet未在名称实体识别中使用。命名实体培训文件是来自各种会议/测试(例如CoNLL)的手动注释字段。

来源:http://opennlp.sourceforge.net/README.html

2

正如我所知,OpenNLP使用最大熵包来提供所有的统计模型 - pos标记,句子检测,NER甚至标记。 Wordnet集成不是OpenNLP的一部分,所以我认为它的特性并未在训练模型中使用。