我准备好去我已经训练过的word2vec模型。我已经连载它作为一个CSV文件:如何在gensim中加载预先训练好的模型并使用它训练doc2vec?
word, v0, v1, ..., vN
house, 0.1234, 0.4567, ..., 0.3461
car, 0.456, 0.677, ..., 0.3461
我想知道什么是我可以加载这个词向量模型gensim
并用它来训练一个段落或doc2vec模型。
这Doc2Vec tutorial说我可以加载一个“# C text format
”形式的模型,但我不知道这实际上是什么意思。什么是“C文本格式”在第一位,但更重要的是:
- 我怎样才能加载我的word2vec模型,并将其用于doc2vec培训?
如何从word2vec模型创建词汇?
我无法证明这一说法,但我认为如果提供预先训练的单词向量,文档向量会更好地工作。我只通过评论相交部分并比较结果来测试这一点。但谢谢你提供了一个答案:) – displayname
什么任务,与多少数据,哪些预先训练的向量更好地工作? – gojomo