2017-03-31 62 views
0

我有一个像这样的tibble。In R如何处理数据?

# A tibble: 200,000 × 3 
    Steps Distance run 
    <int> <dbl> <chr> 
1 1000 33.32683  0 
2 2000 35.02510  0 
3 3000 36.19157  0 
4 4000 37.82663  0 
5 5000 36.30477  0 
6 6000 37.78146  0 
7 7000 38.62345  0 
8 8000 34.84085  0 
9 9000 37.05461  0 
10 10000 43.02439  0 
11 10000 44.12345  1 

我想使用group_by的“run”。 然后将该值存入特定数量的垃圾箱。 做出这样的事情。

run Interval Count 
0 0-10  xx 
0 10-100 xx 
1 0-10  xx 

我发现了一个类似“bin_data”的函数,但它与group_by不兼容。

谢谢。

回答

1

您可以先将数据装箱,然后使用汇总和n来计算每个组中的观察次数。

data_frame(Group = sample(letters[1:2],20,replace = T),Value=runif(20,0,5)) %>% 
    mutate(Bin = cut(Value,breaks = 0:5)) %>% 
    group_by(Group,Bin) %>% 
    summarise(Count = n()) 

Source: local data frame [8 x 3] 
Groups: Group [?] 

    Group Bin Count 
    <chr> <fctr> <int> 
1  a (0,1]  1 
2  a (1,2]  6 
3  a (2,3]  2 
4  a (4,5]  4 
5  b (0,1]  1 
6  b (1,2]  2 
7  b (3,4]  2 
8  b (4,5]  2 
+0

谢谢!这有助于。就我而言,我可以使用cut_width。 – wei