如何按小时对数据进行分组？

我看了我的数据转化为R，在这里我感到小时，下面的代码试图组我的数据：如何按小时对数据进行分组？

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE) 

tweets %>% 
group_by(format(Time, "%H"), Word) %>% 
summarise(count=n())

当我运行这段代码，我得到它，我不能得到一个错误（如下图所示），我头围：

“错误mutate_impl（。数据，点）：无效‘微调’说法”

我想知道是否有人能帮助我解决这个问题？

感谢詹姆斯

数据集的样品是通过此链接访问：https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

来源

2017-04-06 jr134

这为我工作：

tweets %>% 
    mutate(Time = as.POSIXct(Time)) %>% 
    group_by(lubridate::hour(Time), Word) %>% 
    summarise(count=n()) %>% 
    arrange(desc(count))

将其转换为POSIXct让您使用lubridate的小时功能这很方便。

来源

2017-04-06 18:29:21

谢谢你的作品，真的很感谢帮助:-)我一直在花时间来让这个工作。 @Adrian Martin我想知道是否有任何好消息来了解更多有关使用dplyr和lubridate的信息？ – jr134

我分别学到了它们。需要一点时间才能舒适地使用dplyr。 Lubridate的学习非常简单 - 只需在数据上随时调用“str（）”来找出所有类都是什么类。我建议在这里使用dplyr上的RStudio备忘单：https：//www.rstudio.com/resources/cheatsheets/。 –

如何按小时对数据进行分组？

回答

相关问题