2
NGRAM使用像R下面的命令就可以让你期望的ngram的级别执行:范围R中
myDfm <- dfm(txt, ngrams = 2, ignoredFeatures = stopwords("english"))
是否可以给出像NGRAM一个范围(1 ,3)?
实施例的代码在python:
vectorizer = TfidVectorizer(stop_words=stop_words, use_idf=True, ngram=range(1, 3))