我使用Stanford POS tagger与GATE Twitter model和标记器需要大约3秒来初始化,这是正常还是我正确加载它?Stanford POS tagger与GATE twitter模型很慢
小样本代码:
package tweet.nlp.test;
import edu.stanford.nlp.tagger.maxent.MaxentTagger;
public class TweetNLPTest {
public static void main(String[] args) {
String text = "My sister won't tell me where she hid my food. She's fueling my anorexia. #bestsisteraward #not ";
MaxentTagger tagger = new MaxentTagger("models/gate-EN-twitter.model");
String taggedText = tagger.tagString(text);
}
}
输出:
从模型读取POS恶搞模型/门EN-twitter.model ... 警告:没有语言集,没有指定开放类标签,也没有指定封闭类标签;假设所有标签都是开放类标签 完成[3.1秒]。
My_PRP $ sister_NN won't_MD tell_VB me_PRP where_WRB she_PRP hid_VBD my_PRP $ food._NN She's_VBZ fueling_VBG my_PRP $ anorexia._NN #bestsisteraward_HT #not_HT _HT BUILD SUCCESSFUL (总时间:3秒)
看起来正常的我。 – Yasen 2014-11-02 07:51:14
@Yasen我想也许我没有这样做,因为GATE模型扩展名为'.model',而其他模型扩展名为'.tagger'。这不需要做任何事情吗? – 2014-11-02 12:36:46