1
我曾尝试过几个此站点上的以前的帖子,但没有成功。基本上我有形式的数据集:将列中的数据重新整形为具有测量变量的因子的问题
Year Measurement
2006 25.5
2006 19.2
2005 10.3
2005 30.7
2005 15.5
2005 37.1
2004 10.2
2004 19.6
2004 11.7
在哪里我需要的是:
2006 2005 2004
25.5 10.3 10.2
19.2 30.7 19.6
NA 15.5 11.7
NA 37.1 NA
最后,我需要的是每年为变量的箱线图,并能够在这些年中进行邓肯测试。如果他们能帮助我,我会为任何人购买一杯饮料!我之前做过类似的事情,不能为我的生活找到代码。
尝试下面的建议后:
> x <- df %>%
+ group_by(Year) %>% mutate(idx = row_number())
> spread(Year) %>%
+ select("2006", "2005", "2004")
Error: Please supply column name
而且x的输出表:
> x
Source: local data frame [1,566 x 3]
Groups: Year [108]
Year SO4 idx
<int> <dbl> <int>
1 2007 26.34704 1
2 2007 90.44014 2
3 2007 46.90688 3
4 2007 49.58418 4
5 2007 74.22378 5
6 2007 40.61453 6
7 2006 60.19040 1
8 2006 53.03285 2
9 2006 44.14015 3
10 2006 29.36072 4
# ... with 1,556 more rows
如果您使用'group_by(Year)%>%mutate(idx = row_number())'而不是'rownames_to_column()',您将获得所需的输出。 –
这给出:%>% + select(“2006”,“2005”,“2004” ) 错误:请提供列名称' –
如果您使用'dput'提供了正确的数据集,我可以帮助您更好。 – jsb