2015-04-02 86 views
-1

使用stanford我想在做pos标记后在我的句子中得到所有的形容词。我尝试了一些方法并且没有工作。有没有什么方法可以从句子中得到所有的形容词(JJ)。可能已经有这样的问题了,但我没有找到正确的答案。在pos标记后提取形容词

 MaxentTagger tagger = new MaxentTagger("taggers/left3words-wsj-0-18.tagger"); 
     String sample = "feeling happy"; 
     String tagged = tagger.tagString(sample); 
System.out.println(tagged); 

     output : feeling/VBG happy/JJ 

回答

0

您需要首先标记句子,然后您将在一对(词,词性标记)对中包含一个字符串列表,因为您只需要词性标记,您可以通过循环将其过滤掉在你的语料库中的所有单词。 这里是它是从语料库

file=open(product_name,'w'); 
bags=nltk.bigrams(tagged_sentences) 
distribution = nltk.FreqDist(bags) 
c = Counter(distribution) 
for k,count in c.most_common(): 
    if ((k[0][1])=='JJ')): 
    do something... 

上面的代码是在Python过滤形容词了Python代码的一小段,所以我希望你不会觉得很难看。第一行打开文件,第二行标记语料库中的所有单词。 c返回的列表格式为[(word,tag),(word,tag)....],所以你必须检查列表的每一个第二个索引,如果它匹配'JJ',你可以过滤它。