我还需要在模型测试中加载word2vec模型吗？

这可能听起来像一个天真的问题，但我对此很新。假设我使用Google预先训练好的word2vector模型（https://github.com/dav/word2vec）来训练分类模型。我保存我的分类模型。现在我将分类模型加载到内存中以测试新实例。我是否需要再次加载Google word2vector模型？或者它只用于训练我的模型？我还需要在模型测试中加载word2vec模型吗？

来源

2017-06-13 user697911

这取决于您的语料库和测试示例的结构和预处理方式。

您可能正在使用预先训练的单词向量将文本转换为数字特征。首先，文本示例被矢量化以训练分类器。后来，其他（测试/生产）文本示例将被相同的矢量化，并呈现给分类器以得到其判断。

因此，您需要使用与培训期间使用的相同的文本到矢量的测试/生产文本示例过程。也许你已经在单独的早期批量步骤中完成了这一步，在这种情况下，您已经具有分类器使用的向量形式的特征。但是通常你的分类器管道本身会采用原始文本并对其进行矢量化 - 在这种情况下，它需要在测试时间提供与训练期间可用的相同的预先训练（词） - >（矢量）映射。

来源

2017-06-13 22:48:09 gojomo

我还需要在模型测试中加载word2vec模型吗？

回答

相关问题