我最后一个问题的答案帮助我了解dplyr
n()
。但我仍然无法适用于我想解决的问题。所以,我在这里发布数据和实际问题。数据如下所示计算多个栏和组在R
finalCalledPartyNumber Call Day Call Date Block Answered Call Duration Opty ID Opty Created Date BC ID
19183598259 Monday 2016-12-05 12:26:46 Block 2(12:30 pm) 1 5 1234 <NA> <NA>
17135796188 Monday 2016-12-05 12:18:24 Block 2(12:30 pm) 1 16 <NA> <NA> 3456
19183598259 Monday 2016-12-05 15:43:33 Block 4(5:30 pm) 1 10 <NA> <NA> 4567
17135796188 Tuesday 2016-12-06 11:53:50 Block 2(12:30 pm) 1 85 <NA> <NA> 5566
19014741000 Tuesday 2016-12-06 12:00:11 Block 2(12:30 pm) 1 42 6789 <NA> <NA>
19014741000 Tuesday 2016-12-06 10:43:20 Block 2(12:30 pm) 1 58 2345 <NA> <NA>
BC Created Date
<NA>
<NA>
<NA>
<NA>
<NA>
<NA>
对于每个finalCalledPartyNumber
,我要计算次,每次finallCalledPartyNumber
叫的Opty ID
和BC ID
数量,数量。该数据集是巨大的,并且<NA>
只是意味着没有Opty ID
或BC ID
被创建。
输出:
finalCalledPartyNumber n_opty n_BC n_calls
19183598259 1 1 2
17135796188 0 2 2
19014741000 2 0 2
我感谢你的帮助。谢谢。
如果你没有你想要排除的NULL,'count'并不需要一个参数:你可以用'count(1)'替换count([finalCalledPartyNumber])'。所以'n()'在这里应该很好,如果你有空值,就把它们过滤掉。 – HubertL
[请重现例子](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) – Masoud