2012-03-18 53 views
8

我正在尝试使用NLTK和Python学习(英语)自然语言处理。 有没有办法在POS标签期间或之后获得动词的不定式形式。如何使用NLTK(pos标记)获得不定式形式的动词

例如:

  • 是(VBZ)=>是
  • 提供(VBN)=>使用,以提供
  • (VBG)=>可使用
+0

没有一个完整的答案,但我会调查WordNet(是的,NLTK将WordNet作为下载) – winwaed 2012-03-19 01:18:59

回答

15

关闭,你需要在开头添加'to':

>>> from nltk.stem.wordnet import WordNetLemmatizer 
>>> lemmatizer = WordNetLemmatizer() 
>>> lemmatizer.lemmatize('is', 'v') 
'be' 
>>> lemmatizer.lemmatize('provided', 'v') 
'provide' 
>>> lemmatizer.lemmatize('using', 'v') 
'use'