我被给了几百个excel文件,其中数据以“风格化”格式存储。当我批量转换的文件为.csv并在相关线读,从一个单一的文件中的数据是这样的:来自单个列中多个变量的数据,如何修复? - R dataframe
data.frame(x1= c("year", "2014", "site", "28",NA,NA), x2= LETTERS[1:6])
x1 x2
1 year A
2 2014 B
3 site C
4 28 D
5 <NA> E
6 <NA> F
我希望它看起来像这样:
data.frame(year= rep("2014",6), site= rep("28",6), x2= LETTERS[1:6])
year site x2
1 2014 28 A
2 2014 28 B
3 2014 28 C
4 2014 28 D
5 2014 28 E
6 2014 28 F
正如你可以看到,单个列中存储了2个变量名称(年份和地点)及其数据(“2014”和“28”)。 (变量数据总是在变量名后面的行中。)数据框中的其他变量(在本例中为x2)格式正确。
我可以问一些关于如何有效地将这些变量存入自己的列的建议吗?我需要将这个解决方案应用于大约100个不同长度的数据帧,然后才能成为1.
更简单的是,'df $ year < - df $ x1 [其中(df $ x1 ==“year”)+ 1 ]'和'df $ site < - df $ x1 [其中(df $ x1 ==“site”)+ 1]' –
确实,链式符号总是令人惊讶,但我发现我的目的是:然后是链接,一旦我明白了其含义。 – Chris