2017-07-18 112 views
2

NGRAM使用像R下面的命令就可以让你期望的ngram的级别执行:范围R中

myDfm <- dfm(txt, ngrams = 2, ignoredFeatures = stopwords("english")) 

是否可以给出像NGRAM一个范围(1 ,3)?

实施例的代码在python:

vectorizer = TfidVectorizer(stop_words=stop_words, use_idf=True, ngram=range(1, 3)) 

回答

1
myDfm <- dfm(txt, ngrams = c(1,3), ignoredFeatures = stopwords("english"))