2017-05-30 100 views

回答

3

使用正则表达式来删除不需要的字符,例如:

dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE) 

去除除了字字符和空格一切。要做更复杂的替换,请查看帮助主题?regexp

也看看编码(Encodingiconv在这里很有帮助。),也许文本是正确的,但假定错误的编码。