5
我是nlp的新手,我试图使用斯坦福解析器从文本中提取(NP)句子,我想检索文本中标记部分(NP)从输出解析树中提取文本
如果一个零件被标记(NP)并且其中的一个较小零件也被标记(NP)我想采取较小的部分。
到现在我能够做到什么,我想在下面的方法:
private static ArrayList<Tree> extract(Tree t)
{
ArrayList<Tree> wanted = new ArrayList<Tree>();
if (t.label().value().equals("NP"))
{
wanted.add(t);
for (Tree child : t.children())
{
ArrayList<Tree> temp = new ArrayList<Tree>();
temp=extract(child);
if(temp.size()>0)
{
int o=-1;
o=wanted.indexOf(t);
if(o!=-1)
wanted.remove(o);
}
wanted.addAll(temp);
}
}
else
for (Tree child : t.children())
wanted.addAll(extract(child));
return wanted;
}
这个方法的返回值类型是树木列表,当我做到以下几点:
LexicalizedParser parser = LexicalizedParser.loadModel();
x = parser.apply("Who owns club barcelona?");
outs=extract(x);
for(int i=0;i<outs.size();i++){System.out.println("tree #"+i+": "+outs.get(i));}
是:
tree #0: (NP (NN club) (NN barcelona))
我想要的输出为"club barcelona"
向右走,没有标签,我TRIE d的.labels();
财产和.label().value();
它们返回的标签,而不是