我想了解group_by
函数的工作方式dplyr
。我正在使用airquality
数据集,它与datasets
包link一起提供。试图了解dplyr函数 - group_by
我理解是,如果我做到以下几点,就应该安排在Temp
可变
airquality_max1 <- airquality %>% arrange(Temp)
递增的顺序记录我看到在airquality_max1
的情况。我现在想按照Temp
的顺序排列记录,但是按Month
分组。所以最终结果应该首先按照Temp
的升序排列Month == 5
的所有记录。然后,它应该有Month == 6
所有记录中增加Temp
秩序等等,所以我用下面的命令
airquality_max2 <- airquality %>% group_by(Month) %>% arrange(Temp)
不过,我发现的是,结果仍然是增加的Temp
顺序而已,不进行分组通过Month
,即,airquality_max1
和airquality_max2
是相等的。
我不知道为什么Month
的分组没有发生在arrange
函数之前。任何人都可以帮助我理解我在这里做错了什么?
除了试图按列对数据框进行排序的问题之外,我试图理解group_by
的行为,因为我试图用它来解释group_by
对某人的应用。
也许你还需要在'arrange'中添加'Month'参数。 'airquality_max2 < - airquality%>%arrange(Month,Temp)' –
排序不是聚合,所以没有必要使用'group_by' ... – MichaelChirico
我试图用这个作为迂腐的例子来显示'group_by',但偶然发现这种行为。 – SN248