我想总结R中的所有观察项目,但数据包含重复项 ,我不想将它们计为双倍;只有一次。每次Emittent应只计为一项。如何获得R中的一个子组中的单个值
到目前为止,我已经尝试下面的语法 count(Subgroup_2016, vars= c("Emittent"))
我在数据帧中的工作R.
我想总结R中的所有观察项目,但数据包含重复项 ,我不想将它们计为双倍;只有一次。每次Emittent应只计为一项。如何获得R中的一个子组中的单个值
到目前为止,我已经尝试下面的语法 count(Subgroup_2016, vars= c("Emittent"))
我在数据帧中的工作R.
可能n_distinct
(使用dplyr
),而不是count
你所寻找的是。
例如使用mtcars
内置的数据集:
n_distinct(mtcars$cyl)
# [1] 3
你的情况:
n_distinct(Subgroup_2016$Emittent)
'sum(!duplicated(Subgroup_2016 $ Emittent))' –
是否还有一种方法可以用此公式提取对? n_distinct(Subgroup_2016 $ Emittent&Investor) - 我会建议:n_distinct(DF $ Emittent,DF $ Investor) – Bonsaibubble
'n_distinct(c(Subgroup_2016 $ Emittent,Subgroup_2016 $ Investor))' – LyzandeR
你的问题不是很清楚你想知道不同的价值有多少是“ “Subgroup_2016”'dataframe'的“Emittent”列?如果是这种情况,你只需要做'长度(独特的(Subgroup_2016 $ Emittent))'。 – Smich7