我想在每个Id级别出现第一个“C”之前计算“I”的出现次数。我已经试过这段代码,但可以计算列中出现的所有“I”。 代码我试过在特定字母之前计算字母表的出现
library(plyr)
Impres = ddply(df, .(Id), summarize, No_of_I_before_First_C = length(which(Character == "I")))
的样本数据
Id Character
1 I
1 I
1 C
1 I
2 I
2 C
输出应该是这样的
Id Count_Of_I_before_First_C
1 2
2 1
这将是相当大的数据集 – Bulat
慢@Bulat我只是跟随'的问题agregate'标签(即没有包)。我知道'dplyr'和'data.table'都有更高效的方法 – Sotos