2016-12-14 988 views
0

我使用word2vec,wiki语料库我受过训练,如果输入的单词不在word2vec的词汇表中,我该怎么办?KeyError:单词'词汇'不在词汇表中'word2vec

测试这一点:

model = word2vec.Word2Vec.load('model/' + 'wiki_chinese_word2vec.model')  
model['boom'] 

错误:

KeyError("word '%s' not in vocabulary" % word)

+0

检查'如果“潮”模型'取回之前。 – DyZ

+0

这是一个很好的例子,我在wiki的语料库中检查了我想要的单词,但在模型中没有。 –

回答

0

当你说

what can I do if the word I input not in vocabulary in word2vec

我解释这两种方式

1)如何逃避这个例外:你可以使用try,catch

2)如何处理这个例外情况:重新训练模型,再次容纳丢失的单词。你可以选择增量训练模型,新的语料库,在word2vec中,请详细阅读gensim教程。

我推测,“潮”不可用,你已经通过了主体,因此麻烦

2

尝试使用*尝试& *除了

try: 
     c = model['boom'] 
except KeyError: 
     print "not in vocabulary" 
     c = 0