我在我的代码,这个错误,我不知道如何固定 import nltk
from nltk.util import ngrams
def word_grams(words, min=1, max=4):
s = []
for n in range(min, max):
for ngram in ngrams(words, n):
s.append('
我有一个表像下面: URN Firm_Name
0 104472 R.X. Yah & Co
1 104873 Big Building Society
2 109986 St James's Society
3 114058 The Kensington Society Ltd
4 113438 MMV Oil Associates Ltd
而且我想算Fir
我有一个包含2柱csv文件“投诉详细”和“DispositionCode'.I要的complaintDetails分为8不同类别dispostionCode的如‘门反锁’ ,'供应商错误','缺少密钥或锁'... 数据集显示在图像中。 enter image description here 什么是很好的方法来分类和找到准确性。 起初我试图从ComplaintDetails去除停用词然后用naiv