2017-10-28 296 views
1

我正在处理两个包含来自两个不同帐户的推文数据的数据框。第一个数据框正在处理这个twitter帐户,并在我的R控制台中返回一个数据框。rep(space,max_width)中的错误:无效的'times'参数;在一列

baudet_tweets <- userTimeline("thierrybaudet", n = 3200, includeRts = TRUE) 
baudet_tweets_df <- tbl_df(map_df(baudet_tweets, as.data.frame)) 

然而,对于不同的Twitter帐户相同的代码给我的错误:

klaver_tweets <- userTimeline("jesseklaver", n = 3200, includeRts = TRUE) 
klaver_tweets_df <- tbl_df(map_df(klaver_tweets, as.data.frame)) 

Error in rep(space, max_width) : invalid 'times' argument

我认为这是文本列,因为当我过滤掉select(klaver_tweets_df, text)文本列代码有效。但我需要text专栏进行文本分析......我觉得奇怪的是,text专栏baudet_tweets_df正常工作。我的代码不是真正可重现的,但这里是df的图像,因为我可以使用View(klaver_tweets_df). Maybe only klaver_tweets_df`包含表情符号?如果是的话我怎样才能删除它们?

df$text klaver

回答

1

删除表情符号的奏效了!

klaver_tweets_df$text <- gsub("[^\x01-\x7F]", "", klaver_tweets_df$text)