2014-11-01 126 views
0

我使用Stanford POS taggerGATE Twitter model和标记器需要大约3秒来初始化,这是正常还是我正确加载它?Stanford POS tagger与GATE twitter模型很慢

小样本代码:

package tweet.nlp.test; 

import edu.stanford.nlp.tagger.maxent.MaxentTagger; 

public class TweetNLPTest { 

    public static void main(String[] args) { 
     String text = "My sister won't tell me where she hid my food. She's fueling my anorexia. #bestsisteraward #not "; 

     MaxentTagger tagger = new MaxentTagger("models/gate-EN-twitter.model"); 

     String taggedText = tagger.tagString(text); 
    } 
} 

输出:

从模型读取POS恶搞模型/门EN-twitter.model ... 警告:没有语言集,没有指定开放类标签,也没有指定封闭类标签;假设所有标签都是开放类标签 完成[3.1秒]。

My_PRP $ sister_NN won't_MD tell_VB me_PRP where_WRB she_PRP hid_VBD my_PRP $ food._NN She's_VBZ fueling_VBG my_PRP $ anorexia._NN #bestsisteraward_HT #not_HT _HT BUILD SUCCESSFUL (总时间:3秒)

+1

看起来正常的我。 – Yasen 2014-11-02 07:51:14

+0

@Yasen我想也许我没有这样做,因为GATE模型扩展名为'.model',而其他模型扩展名为'.tagger'。这不需要做任何事情吗? – 2014-11-02 12:36:46

回答

2

对我来说,看起来很正常,初始化大约需要2到3秒。 .tagger.model相同。

你可以看到它在斯坦福标注器提供的样本模型:

model = wsj-0-18-bidirectional-nodistsim.tagger 
+0

那么,至少我发现有人给代表:P – 2014-11-27 16:29:34

+0

其他事情,我真的不明白,如果你想使用GATE API,但如果是这样,你可以创建一个新的StanfordTaggerPR像'PR =(LanguageAnalyser) Factory.createResource(“gate.stanford.Tagger”,params,features);' – 2014-11-27 17:12:47

+0

好的,谢谢! – 2014-11-27 17:42:09