我目前正在研究一个项目,考察员工流失率。到目前为止,我已经创建了一个表,看起来像下面的示例:R - 按位置计算每月的团队规模总数
library(tidyverse)
Data <- data.frame(Month = c("Jan", "Feb", "March", "Jan", "Feb", "March"),
Location = c("Sheffield", "Sheffield", "Sheffield","London", "London", "London"),
Joiners = c(7,3,8,4,9,1),
Leavers = c(1,5,9,3,2,5)) %>%
mutate(Net_Change = Joiners - Leavers)
我想通过采取基于位置和月Net_Change列的总和来计算团队规模(按顺序排列)。例如,伦敦2月队的规模应该等于8(1 + 7),而3月队的规模应该等于4(1 + 7-4)。
我已经尝试过使用dplyr'summarize'函数来做这件事,但不成功。如果'tidyverse'方法适用,那将是很棒的。
非常感谢您的帮助!
看来你正在寻找'cumsum()'。 – jazzurro
感谢那 – George