2016-10-10 73 views

回答

1

是的,但不是开箱即用:您可以在布朗语料库上训练您自己的标记器。性能将取决于您需要标记的文本类型以及您尝试使用不同类型的标记器时需要付出多少努力。 NLTK书的Chapter 5将逐步引导您制作一个相当不错的标记器的过程(特别是关于N-Gram Tagging的部分),它甚至使用布朗语料库作为示例 - 您不需要更改一个东西。

+0

谢谢。我尝试使用棕色语料库来训练UnigramTagger – user3606057

+0

这很好,但Unigram tagger几乎没用:它只是用最常见的POS标记每个单词。继续阅读,直到你到达trigram taggers(尽管你的表演可能在bigrams之后变平)。 – alexis

+0

我如何训练tagger为了有效? – user3606057