stop-words

    10热度

    4回答

    具体而言,我想索引一切(如谁)没有停止单词列表。弹性搜索是否足够灵活且易于更改?

    73热度

    7回答

    如何删除停止的话让我有我想从使用 stopwords.words('english') 去除停止词我挣扎如何使用这个我的代码内只是单纯地拿出一个数据集这些字。我的单词的列表,从这个数据集已经,我用的比较这个列表,而删除停用词挣扎的一部分。 任何帮助表示赞赏。

    4热度

    6回答

    我有一些代码可以从我的数据集中删除停用词,因为停止列表似乎并没有删除我希望的大多数单词,我正在寻找将单词添加到这个停止列表,以便它将在这种情况下删除它们。 我使用去除停止词的代码是: word_list2 = [w.strip() for w in word_list if w.strip() not in nltk.corpus.stopwords.words('english')] 我不能

    5热度

    2回答

    有没有办法让我的SQL Server 2008 FullText Catalog使用的StopWord列表? 并使用它,在我的C#代码隐藏? 我想在ASP.NET页面中使用它来搜索术语并突出显示它们。 搜索页面和高光已经正常工作,但我想提高亮点。我不想突出显示我的StopWord列表中的单词。

    0热度

    2回答

    单词是否有引号,逗号分隔还是换行?

    2热度

    5回答

    单词“a”,“the”,“best”,“kind”。我敢肯定有实现这一 只是要清楚的好方法,我找 可实施,最好是在红宝石的最简单的解决方案。 我的错误,有高水平的耐受 如果常用短语库是我需要的,与太

    1热度

    3回答

    我已经创建了一个Perl文件来加载“Stop words”数组。 然后我加载一个包含“.ner”文件的目录。 每个文件被打开,每个单词被分割并与停止文件中的单词进行比较。 如果单词匹配它改为“”(没有任何东西 - 并被移除) 然后我将该文件复制到另一个位置。所以我可以区分带有停用词和无文件的文件。 但是,这是否将文件更改为现在不包含停用词或将其还原为原始文件? #!/usr/bin/perl

    0热度

    2回答

    我的功能可以解析文本并删除短语,如“a”,“the”,“in”,“on”,“at”等。 这些词的列表可能会在未来修改。而且,在不同列表之间切换(即针对不同语言)也可能是一种选择。 那么,我应该在哪里存储这样的列表? 50-200字 许多读取每分钟 几乎没有写入(修改) - 例如,一旦在几个月 我在我的脑海这些选项: 里面的代码清单(最快的,但它听起来并不像一个很好的做法) 单独的文件“stop_w

    8热度

    4回答

    我想要一个特定的实现,使得用户提供类似的文本块: “的要求 - 使用Linux操作系统,Apache 2的工作知识,在LAMP环境, 的MySQL 5和PHP 5, - Web 2.0的知识标准 - 舒适的使用JSON - 跨浏览器的JavaScript编程和jQuery等 - - 知识版本控制软件如与框架,Zend公司,哎呀 工作经验手子版本将是 更可取。“ 我想要做的是自动选择相关的关键字,并

    4热度

    2回答

    我正在使用mysql内置的布尔全文特征来搜索数据集。 (MATCH ... AGAINST语法)。 我遇到了MySql的默认停用词表中的关键字没有返回任何结果的问题。例如,“之前”,“之间”等。 有(我认为)没有办法在运行时禁用MySql的停用词。因为我在共享服务器(DreamHost)上托管我的网站,所以我没有使用停用词禁用的重新编译MySQL的选项。 我想知道如果有人对上述问题有什么建议? (