2011-03-07 57 views
1

我想要一个使用NLTK和Python在给定句子或文本中标记习语的代码。使用nltk和python的代码

+5

我想读这个问题。 – 2011-03-07 08:59:53

+7

如果你得到这个答案你的公司应该支付SO – Rafi 2011-03-07 09:06:18

+1

你的意思是词性标注? – Joe 2011-03-08 14:41:00

回答

1

取决于“成语”的含义。乔对POS标签的建议可能是一个好的开始 - 也许是你真正的追求。如果是这样,请阅读Bird等人的“用Python进行自然语言处理”。它由O'Reilly出版,但也可以通过Creative Commons许可在线获得。这将使您开始使用POS标记。它也很好地回顾了NLTK的能力。例如,是否可以调整一些“命名实体识别”技术来做你想做的事情?或者你想要的东西太简单了。我怀疑后者是这种情况(Rafi暗示),但你会在你的旅程中发现。也许你会在旅途中发展出新的东西,在这种情况下,我希望你回馈给NLTK社区。