2017-04-06 70 views
0

我看了我的数据转化为R,在这里我感到小时,下面的代码试图组我的数据:如何按小时对数据进行分组?

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE) 

tweets %>% 
group_by(format(Time, "%H"), Word) %>% 
summarise(count=n()) 

当我运行这段代码,我得到它,我不能得到一个错误(如下图所示),我头围:

  • “错误mutate_impl(。数据,点):无效‘微调’说法”

我想知道是否有人能帮助我解决这个问题?

感谢詹姆斯

数据集的样品是通过此链接访问:https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

回答

2

这为我工作:

tweets %>% 
    mutate(Time = as.POSIXct(Time)) %>% 
    group_by(lubridate::hour(Time), Word) %>% 
    summarise(count=n()) %>% 
    arrange(desc(count)) 

将其转换为POSIXct让您使用lubridate的小时功能这很方便。

+0

谢谢你的作品,真的很感谢帮助:-)我一直在花时间来让这个工作。 @Adrian Martin我想知道是否有任何好消息来了解更多有关使用dplyr和lubridate的信息? – jr134

+0

我分别学到了它们。需要一点时间才能舒适地使用dplyr。 Lubridate的学习非常简单 - 只需在数据上随时调用“str()”来找出所有类都是什么类。我建议在这里使用dplyr上的RStudio备忘单:https://www.rstudio.com/resources/cheatsheets/。 –

相关问题