我的目标是统计列中有多少重复。
所以我有一列3516 obs。 1个变量,
,所有日期都有大约144个重复,每个从1/4/16到7/3/16。
示例:(例如,为了便于说明,每个放置一个副本)
1/4/16
1/4/16
31/3/16
31/3/16
30/3/16
30/3/16
29/3/16
29/3/16
28/3/16
28/3/16
所以我使用了函数date = count(date)
,其中date是我的df日期。
但是一旦我执行它,我的日期顺序就不再按顺序了。
希望有人能解决我的问题。统计列的重复次数
统计列的重复次数
回答
如果我们需要计数的重复总数
sum(table(df1$date)-1)
#[1] 5
假设,我们需要每个日期的计数,一个选择是按“日期”,并获得行数。这可以通过data.table
完成。
library(data.table)
setDT(df1)[, .N, date]
感谢这就是我要找的! –
如果你想在你列的重复次数的计数,你可以使用duplicated
sum(duplicated(df$V1))
#[1] 5
假设V1
作为列名。
编辑
按照更新,如果你想每一个数据的数量,你可以使用table
功能,这将给你正是
table(df$V1)
#1/4/16 28/3/16 29/3/16 30/3/16 31/3/16
# 2 2 2 2 2
我道歉,如果我没有正确地短语我的问题,我的预期输出是擦除重复,并有另一列列出重复次数被计数 –
@AmosOng嗨!谢谢。答案已更新。 –
一种方法是创建一个数据使用您的初始数据的唯一值保留该顺序,然后使用来自dplyr
数据包加入两个数据帧。请注意,您的专栏的名称应该相同。
Initial_data <- structure(list(V1 = structure(c(1L, 1L, 5L, 5L, 4L, 4L, 3L, 3L,
2L, 2L, 2L), .Label = c("1/4/16", "28/3/16", "29/3/16", "30/3/16",
"31/3/16"), class = "factor")), .Names = "V1", class = "data.frame", row.names = c(NA,
-11L))
df1 <- unique(Initial_data)
count1 <- count(df1)
left_join(df1, count1, by = 'V1')
# V1 freq
#1 1/4/16 2
#2 31/3/16 2
#3 30/3/16 2
#4 29/3/16 2
#5 28/3/16 3
- 1. 统计一列的重复次数
- 2. 计数重复次数[R]
- 3. 如果列数据重复,mysql不会重复计数两次
- 4. 如何统计变量在javascript数组中重复的次数?
- 5. numpy:累计重复次数
- 6. 统计一组字符的重复次数
- 7. JavaScript重复元素的计数次数
- 8. MySQL的使用次数,重复计数
- 9. 如何统计重复的整数
- 10. 如何计算数组列表中单词的重复次数?
- 11. 使用重复列计数
- 12. 计数重复列表(Java)
- 13. 每分钟计数重复次数作为列存储
- 14. 计算Python中重复序列的最长出现次数
- 15. 你如何计算列表中最大的重复次数?
- 16. 查找和计算重复次数
- 17. 计算重复次数的次数R代码
- 18. 重复多次计算
- 19. 多列计算重复计数
- 20. 如何统计SQL中计算列的出现次数?
- 21. 如何统计收集对象中对象的重复次数。 PHP/Laravel
- 22. 计算表中字段重复次数超过5次的行
- 23. 计数的重复号码列表
- 24. 计数列表框中的重复
- 25. Laravel统计最重复的项目
- 26. 如何统计scala中的重复值?
- 27. 重复计数
- 28. 重复递增列表部分次数
- 29. 计算跨数据子集的可变长度序列的重复次数
- 30. 如何统计数据库中重复记录的数量?
您的预期产出是多少? –
我想创建另一列,并且在日期旁边有重复的数目。 –