OpenNLP find（）方法

此刻我试图在文档中查找名称。即时通讯使用下面的方法来找到名字：OpenNLP find（）方法

find(String[] tokens)

我也发现了下面这个方法：

find(String[] tokens,String[][] additionalContext)

我可以做什么用这种方法，如何使用它？

来源

2017-10-13 Sietse

根据opennlp.tools.namefind.NameFinderME apidocs：

public Span[] find(String[] tokens, String[][] additionalContext) 
生成名称标签给定的顺序，通常是一个句子，返回任何标识的名称标记跨度。

参数：

tokens - 序列，典型地一个句子的令牌或字的阵列。

additionalContext - 基于句子外的上下文而又应该使用的特征。

返回：为每个标识的名称的跨度数组。

话虽这么说，可考虑您的令牌是：

String[] tokens = { "lorem", "ipsum", "dolor", "sit", "amet", "adipiscing", "elit" };

但你也想考虑到以下特点“，这是基于上下文的句子之外但也应使用“：

String[][] additionalContext = { 
    { "nullam", "fermentum", "justo", "non", "leo", "rhoncus", "blandit" }, 
    { "phasellus", "at", "diam", "mattis", "arcu", "congue", "consequat" }, 
    { "integer", "at", "tincidunt", "turpis", "eget", "pulvinar", "nisl" } };

这样，您就可以拨打find(tokens, additionalContext)。

请注意，根据code on GitHub,find(String[] tokens)实际上是find(tokens, EMPTY)（和String[][] EMPTY = new String[0][0]）。

来源

2017-12-05 09:50:57

OpenNLP find（）方法

回答

相关问题