gensim

0热度

1回答

当我执行下面的代码 sim_model = gensim.similarities.MatrixSimilarity(corp) sim_model.save("sim_model.pkl") 非但没有“sim_model.pkl”我得到两个文件“sim_model.pkl.index.npy”和“sim_model。 pkl“为什么是这种行为。

5热度

3回答

os.execute没有继承父母的FDS

我有类似于这里所描述的一个问题： Prevent fork() from copying sockets 基本上，我的Lua脚本中，我产卵另一个脚本：不需要与我的脚本通信两种方式继续我的剧本已经完成后运行是一个第三方程序，代码我没有控制权的问题是，我的Lua脚本打开一个TCP套接字来侦听特定端口上，它的退出后尽管明确server:close()孩子（或者更具体地说其子女）持有到插座和保持端

0热度

1回答

Gensim doc2vec句子标记

我试图理解doc2vec，我可以用它来解决我的情况。我想使用TaggedSentences（[words]，[tags]）为一个或多个标签标注句子，但不确定如果我的理解是正确的。所以基本上，我需要这样的事情发生（或我完全没谱）我创建2个TaggedDocuments TaggedDocument(words=["the", "bird", "flew", "over", "the", "coo

2热度

2回答

gensim.corpora.Dictionary是否有保存频率的频率？

gensim.corpora.Dictionary是否保存了术语频率？从gensim.corpora.Dictionary，它可能得到的话文档频率（即怎么一个特定的词出现在许多文件）： from nltk.corpus import brown from gensim.corpora import Dictionary documents = brown.sents() brown_di

1热度

2回答

是否可以使用文字嵌入搜索文本的一部分？

我发现成功的权重主题为增加这似乎是一句比较在我的情况下工作的词矢量： query1 = vectorize_query("human cat interaction") query2 = vectorize_query("people and cats talk") query3 = vectorize_query("monks predicted frost") query4 = vect

0热度

1回答

如何使用预先训练的单词向量创建gensim word2vec模型？

我使用分布式word2vec算法创建了词向量。现在我有单词和相应的向量。如何使用这些单词和向量来构建gensim word2vec模型？

2热度

3回答

如何使用gsub搜索并使用正则表达式进行替换？

我想过滤一个描述字符串中的标签，并希望将它们制作成锚标签。我无法返回标签的值。我输入的是： a = "this is a sample #tag and the string is having a #second tag too" 我的输出应该是： a = "this is a sample <a href="/tags/tag">#tag</a> and the string is ha

2热度

2回答

Python3.6 - 无法在Windows中导入gensim

我使用Python 3.6.3rc1。执行我的python脚本后，我收到以下消息： Traceback (most recent call last): File "main.py", line 6, in <module> from train import train File "C:\path\train.py", line 2, in <module>

-1热度

1回答

gensim KeyedVectors对象字数

我加载一个KeyedVectors模型，字频似乎像字索引我想念什么？

3热度

2回答

确定在MySQL

可出现在列最大长度表的结构是这样的： registrant_id varchar(16) registrant_name varchar(128) 我想运行，显示所有符合所允许的最大长度，也就是我现在做的项目查询对于上面做： SELECT * FROM `tm_registrant` WHERE length(`registrant_name`) = 128 不过，我不想硬编码1