str的,我使用python2.7,NLTK 3.2.1和python-crfsuite 0.8.4。我正在关注此页面:http://www.nltk.org/api/nltk.tag.html?highlight=stanford#nltk.tag.stanford.NERTagger for nltk.tag.crf模块。 首先,我只是运行此 from nltk.tag import CRFT
我是Mallet的新手,尝试使用CRF功能来执行命名实体识别。我知道有一个例子显示了如何在他们的网站上使用Java导入数据,但它处理纯文本(不是训练集格式)。 现在我有以下格式的可用培训数据(网站上显示的确切格式)。第一列是单词,第二列是标签。 a O
50 AGE
year AGE
old O
man GENDER
with O
a O
history O
of O
suici