nltk

0热度

2回答

我在我的代码，这个错误，我不知道如何固定 import nltk from nltk.util import ngrams def word_grams(words, min=1, max=4): s = [] for n in range(min, max): for ngram in ngrams(words, n): s.append('

1热度

2回答

下载数据时如何阻止NLTK输出到终端？

当我运行我的程序，这是使用： nltk.download('wordnet') from nltk.corpus import wordnet 我得到以下输出到我的终端： [nltk_data] Downloading package wordnet to [nltk_data] /Users/.../nltk_data... [nltk_data] Package wordnet i

0热度

2回答

random.shuffle（someLazyMap）

我目前正在尝试训练我的Python NLTK词性标记器以正确标记德语文本。为了做到这一点我使用的ClassifiedBasedGermanTagger，距离： https://github.com/ptnplanet/NLTK-Contributions/tree/master/ClassifierBasedGermanTagger ，并从该网站训练语料库： http://www.ims.uni-

0热度

2回答

使用NLP的语法检查

我想检查句子是否具有特定的词性标记结构。我可以使用python自然语言工具包来做到吗？如果是这样，怎么样？

3热度

2回答

计数词的频率在大熊猫数据帧

我有一个表像下面： URN Firm_Name 0 104472 R.X. Yah & Co 1 104873 Big Building Society 2 109986 St James's Society 3 114058 The Kensington Society Ltd 4 113438 MMV Oil Associates Ltd 而且我想算Fir

2热度

2回答

无法在Jupyter笔记本中导入NLTK

I 可以从bash运行python或ipython时导入nltk包。所以，NLTK肯定是安装某处（从bash的巨蟒， nltk.__file__是 /home/nadine/anaconda2/lib/python2.7/site-packages/nltk/__init__.pyc）但是，使用Jupyter笔记本电脑（我安装使用蟒蛇，与2.7版本的Python）时，进口NLTK失败： impo

1热度

1回答

NLTK语料库部署Chatterbot Heroku

我的第一个电报chatbot出现问题，用Chatterbot库完成。我的项目是由组成： Procfile 要求（txt文件） telegramtoken（txt文件）运行时（txt文件） NLTK（txt文件） botusers（csv文件） magghybot（py文件） Magghy（PY文件）对话（名为郎文件夹中的阳明文件） math_words（名为郎文件夹中的JSON文件）我部署

0热度

1回答

在Windows上为NLTK安装megam

我需要为Python中的nltk分类例程安装megam。我接着牛奶魔术从this post指令： 0下载从http://www.umiacs.umd.edu/~hal/megam/index.html 1.用gcc安装了Cygwin megam来源，制作和OCaml的包 2.试图编译megam与时变makefile文件 3 makefile我收到以下内容的错误 make ocamldep *.m

1热度

1回答

无法移除停止词; NLP

我有一个包含2柱csv文件“投诉详细”和“DispositionCode'.I要的complaintDetails分为8不同类别dispostionCode的如‘门反锁’ ，'供应商错误'，'缺少密钥或锁'... 数据集显示在图像中。 enter image description here 什么是很好的方法来分类和找到准确性。起初我试图从ComplaintDetails去除停用词然后用naiv

1热度

1回答

基于词典的情感分析的准确性

我对我已经获取的一组Twitter数据执行不同的情感分析技术。它们基于词典（Vader Sentiment和SentiWordNet），因此不需要预先标记的数据。我想知道是否有方法（如F-Score，ROC/AUC）来计算分类器的准确性。我所知道的大多数方法都需要一个目标来比较结果。