gensim

    0热度

    1回答

    当我执行下面的代码 sim_model = gensim.similarities.MatrixSimilarity(corp) sim_model.save("sim_model.pkl") 非但没有“sim_model.pkl”我得到两个文件“sim_model.pkl.index.npy”和“sim_model。 pkl“为什么是这种行为。

    5热度

    3回答

    我有类似于这里所描述的一个问题: Prevent fork() from copying sockets 基本上,我的Lua脚本中,我产卵另一个脚本: 不需要与我的脚本通信两种方式 继续我的剧本已经完成 后运行是一个第三方程序,代码我没有控制权 的问题是,我的Lua脚本打开一个TCP套接字来侦听特定端口上,它的退出后尽管明确server:close()孩子(或者更具体地说其子女)持有到插座和保持端

    0热度

    1回答

    我试图理解doc2vec,我可以用它来解决我的情况。我想使用TaggedSentences([words],[tags])为一个或多个标签标注句子,但不确定如果我的理解是正确的。 所以基本上,我需要这样的事情发生(或我完全没谱) 我创建2个TaggedDocuments TaggedDocument(words=["the", "bird", "flew", "over", "the", "coo

    2热度

    2回答

    gensim.corpora.Dictionary是否保存了术语频率? 从gensim.corpora.Dictionary,它可能得到的话文档频率(即怎么一个特定的词出现在许多文件): from nltk.corpus import brown from gensim.corpora import Dictionary documents = brown.sents() brown_di

    1热度

    2回答

    我发现成功的权重主题为增加这似乎是一句比较在我的情况下工作的词矢量: query1 = vectorize_query("human cat interaction") query2 = vectorize_query("people and cats talk") query3 = vectorize_query("monks predicted frost") query4 = vect

    0热度

    1回答

    我使用分布式word2vec算法创建了词向量。现在我有单词和相应的向量。如何使用这些单词和向量来构建gen​​sim word2vec模型?

    2热度

    3回答

    我想过滤一个描述字符串中的标签,并希望将它们制作成锚标签。我无法返回标签的值。 我输入的是: a = "this is a sample #tag and the string is having a #second tag too" 我的输出应该是: a = "this is a sample <a href="/tags/tag">#tag</a> and the string is ha

    2热度

    2回答

    我使用Python 3.6.3rc1。执行我的python脚本后,我收到以下消息: Traceback (most recent call last): File "main.py", line 6, in <module> from train import train File "C:\path\train.py", line 2, in <module>

    -1热度

    1回答

    我加载一个KeyedVectors模型,字频似乎像字索引 我想念什么?

    3热度

    2回答

    可出现在列最大长度 表的结构是这样的: registrant_id varchar(16) registrant_name varchar(128) 我想运行,显示所有符合所允许的最大长度,也就是我现在做的项目查询对于上面做: SELECT * FROM `tm_registrant` WHERE length(`registrant_name`) = 128 不过,我不想硬编码1