spacy

    0热度

    1回答

    安装安装spacy与Windows畅达经过7机器,我跑到下面的代码: import spacy nlp = spacy.load('en') 我收到的错误是: Warning: no model found for 'en' Only loading the 'en' tokenizer. 以下一些搜索我跑关于命令行下面的代码(CMD): python -m spacy downlo

    0热度

    2回答

    如何使用python在spaCy中执行预处理步骤,如停用词删除,标点符号删除,词干和词形化。 我有csv文件中的文本数据,如段落和句子。我想做文本清理。 在大熊猫数据帧请多例如通过加载CSV

    0热度

    2回答

    我已经安装了spacy遵循python 2.7使用pip的网站上的说明,并下载了英文模型,也使用pip,但是当我运行一个简单的测试代码时,它返回一个空集作为结果,当在线示例表明它应该识别该主题。我认为spacy并没有连接到模型,因此不会返回任何结果,但它不会给我带来任何错误,并表明它已正确连接。 from spacy.en import English nlp = English() sen

    0热度

    1回答

    我使用Ken Benoit和Paul Nulty的quanteda软件包处理文本数据。 我的语料库包含带有完整德语句子的文本,我只想处理每个文本的名词。德语中的一个窍门是仅使用大写字母,但这在句子的开头就会失败。 Text1 <- c("Halle an der Saale ist die grünste Stadt Deutschlands") Text2 <- c("In Hamburg r

    2热度

    1回答

    我看到paper提供了Sense2Vec背后的想法,但是第一个创建的标准spaCy模型是怎么样的?当我从the selection of models下载类似标准“en_core_web_md”模型的东西时,它是如何创建的?有没有我可以阅读的文章或spaCy博客文章? 奖金的问题: 如何在即将到来的spaCy 2.0新车型在尺寸要小得多? 从version 2 Release summary: 此

    0热度

    1回答

    给定一个长度相同的文档字符串s和长度相同的语言掩码l我想用相应的语言模型处理文档的每个部分(span?)。 比方说 s = 'As one would say in German: Wie man auf englisch zu sagen pflegt' l = ['en'] * 27 + ['de'] * 37 我想构建出文档的 import spacy nlp_de = spacy.

    0热度

    1回答

    我想加载数据帧csv到spacy管道。我得到的参数字符串错误这里是我的代码。 from __future__ import unicode_literals nlp = spacy.load('en') data = pd.read_csv("sometextdata.csv") text = [] for line in data.Line: text.append(clea

    0热度

    1回答

    我使用Windows10 64,我一直在使用PIP安装spaCy和安装成功。 pip list给我spacy (1.9.0),我可以在C:\Python27\Lib\site-packages找到spacy文件夹。 但每当我试图import spacy在PyCharm,或 python -c "import os; import spacy; print(os.path.dirname(spacy

    0热度

    1回答

    我知道从文档获取各种属性的基本空间工作流,但是我找不到内置函数来返回单词的位置(开始/结束)这是一个句子的一部分。 有人会知道Spacy有可能吗?

    1热度

    1回答

    我想从文本中使用Spacy的NER为德文文本提取命名实体。我将该服务公开为REST POST请求,该请求将源文本作为输入并返回名称实体(人员,位置,组织)列表的字典(地图)。这些服务使用Linux服务器上托管的Flask Restplus进行公开。 考虑了样本的文字,我获得以下的REST API通过扬鞭UI曝光使用POST请求响应: { "ner_locations": [ "