2013-03-22 73 views
0

我刚刚学习使用Python的nltk。我正在使用POS标记。我想知道的是如何使用标签。例如,这是伪代码:检查Nltk POS标签

words = [] 
teststr = "George did well in the test." 
tokens = nltk.word_tokenize(teststr) 
words = nltk.pos_tag(tokens) 

我想要做这样的事情:

if words[i] == "proper noun": 
    #do something 

如何检查一个单词是否是名词或动词或语音的任何其他部分。 有人可以帮我在这里吗? 谢谢。

回答

2

如果你看看你是返回以下列表中pos_tag函数调用的结果:

[('George', 'NNP'), ('did', 'VBD'), ('well', 'RB'), ('in', 'IN'), ('the', 'DT'), ('test', 'NN'), ('.', '.')] 

如果您遍历清单基础上的价值是你所需要的一个专有名词做一些事情以下代码:

if words[i][1] == 'NNP': 
    # do something 

NNP是一个单数专有名词。该列表中的每个条目都是一个元组,第一个值是单词,第二个值是pos。

+1

非常感谢瑞恩!我现在明白了。对不起,没有声望,所以不能upvote。 – user2201130 2013-03-22 23:34:31