1
我正在尝试对推文进行情感分析。虽然这样做的话的前处理,创造一个矩阵,我得到了以下错误:r中的词干:缺失值
Error in if (any(lens > lim)) stop("There is a limit of ", lim, "characters on the number of characters in a word being stemmed") :
missing value where TRUE/FALSE needed
从14215个鸣叫,我煮下来到产生错误的具体鸣叫,但都没有得到线索如何防止再次发生此错误。 由于其出错的鸣叫是(和代码重现错误):
library(RTextTools)
tweet<-"demonio leg edge sexy we get it u vape PLEASE COME TO NA SOON I HAVE A LUCIEL READY FOR U dominos"
all_tweets= create_matrix(tweet, language="english", minWordLength = 3,
removeStopwords=TRUE, removeNumbers=TRUE, # we can also removeSparseTerms
stemWords=TRUE,removePunctuation = TRUE,removeSparseTerms = 0)
首先,我想理解的错误 - 为什么会发生,然后我的愿望是这将使我的方法防止发生此错误 - 通过选择和删除这样的推文或通过编辑我的create_matrix函数?
嗨,哪个版本你有(R/RTextTools包)。在Windows 64,R 3.2.2和RTextTools 1.4.2上,我无法在您提供的文本上重现错误。 –
我正在使用R版本3.3.0和RTextTools 1.4.2 – user3109578
也许是区域设置或编码的问题。 @lukeA建议似乎也是一种可能性。无论如何,你的代码在这里很有魅力。 –