我遇到的问题是,在我的代码中,我无法获取单个词/标记以匹配停用词从原始文本中删除。相反,我得到了一整句话,因此无法将它与停用词相匹配。请告诉我一种方法,我可以获取个人令牌,然后用停用词匹配并删除它们。请帮帮我。 from nltk.corpus import stopwords
import string, os
def remove_stopwords(ifile):
proces
我在删除停用词时遇到了问题。当我执行我的脚本时:' import nltk
from nltk.corpus import stopwords
file1=open('english.txt', 'r')
english=file1.read()
file1.close()
english_corpus_lowercase =([w.lower() for w in english])
我的代码来计算TF-IDF的语料库是这样的: from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
train_set = "i have a ball", "he is good", "she playe