2014-11-05 200 views
4

我是新与R软件现在R-无效的多字节字符串1

,采用“以旧换新”包”

我有映射文本ploblem为小写

sms_raw<-read.csv(............) 
sms_corpus<-Corpus(VectorSource(sms_raw$text)) 
sms_corpus<-Corpus(VectorSource(sms_raw$text)) 
tm_map(sms_corpus,content_transformer(tolower)) 
error:invalid multubytes string 1 
研究文本挖掘

我想我的csv文件可能是不支持UTF-8,所以我恢复为UTF-8,但没有奏效。

我的操作系统是win8.1

任何人都有这个问题的解决方案,请让我知道。

+0

请提供一个可重复使用的小例子,说明进度停止的位置。 – 2014-11-05 09:00:32

回答

14

的错误我已经很容易地通过编码功能

解决了我的文件的列,其名称为文本包含多字节字符

所以我键入

这个命令转换的“文本”列(多字节)转换为utf8格式

相关问题