2017-02-21 116 views
1

我有两个数据帧,其中两个数据帧都有一个公共列。其中一个数据框有一个额外的行。合并两个数据帧,其中一个数据帧包含额外的行

> df1 
       type  x   y 
1     A  10   417 
2     B  2   575 
3     C  3   14 
4     D  944   205 
5     E  44   87 
6     F  355   883 
7     G  73   150 

> df2  
    X1 X2 X3 X4 X5 X6 term 
1 9 28 3 34 5 39 B 
2 43 7 39 41 46 32 C 
3 17 30 0 27 0 9 D 
4 42 32 1 10 26 49 E 
5 21 17 34 28 35 12 F 
6 16 10 18 25 2 0 G 

我想列的x,y追加从DF1而插入包含term A,而对于各列的其余部分引入NA行到DF2。

的目标是获得如下:

X1 X2 X3 X4 X5 X6 x y term 
    NA NA NA NA NA NA 10 417 A 
    9 28 3 34 5 39 2 575 B 
    43 7 39 41 46 32 3 14 C 
    17 30 0 27 0 9 944 205 D 
    42 32 1 10 26 49 44 87 E 
    21 17 34 28 35 12 355 883 F 
    16 10 18 25 2 0 73 150 G 

我尝试使用公共列合并功能term但没有工作,然后我找到了解决办法

cbindPad <- function(...){ 
    args <- list(...) 
    n <- sapply(args,nrow) 
    mx <- max(n) 
    pad <- function(x, mx){ 
    if (nrow(x) < mx){ 
     nms <- colnames(x) 
     padTemp <- matrix(NA, mx - nrow(x), ncol(x)) 
     colnames(padTemp) <- nms 
     if (ncol(x)==0) { 
     return(padTemp) 
     } else { 
     return(rbind(x,padTemp)) 
     } 
    } 
    else{ 
     return(x) 
    } 
    } 
    rs <- lapply(args,pad,mx) 
    return(do.call(cbind,rs)) 
} 

但这并没有工作。

回答

1

使用merge。请注意,公共列有不同的名称:type对于df1term对于df2,因此您应该通过by.xby.y参数将此信息传递到merge函数。还设置了all=TRUE

> merge(df1, df2, by.x="type", by.y="term", all=TRUE) 
    type x y X1 X2 X3 X4 X5 X6 
1 A 10 417 NA NA NA NA NA NA 
2 B 2 575 9 28 3 34 5 39 
3 C 3 14 43 7 39 41 46 32 
4 D 944 205 17 30 0 27 0 9 
5 E 44 87 42 32 1 10 26 49 
6 F 355 883 21 17 34 28 35 12 
7 G 73 150 16 10 18 25 2 0 
+0

对不起,我实际上重命名保留相同的列名我想我们可以使用'by.x =“type”,by.y =“type”'它确实有效。必须等待接受为答案:) –

+1

@ Null-Hypothesis,当公共列具有相同的名称时,可以使用'by = type'并去掉by.x = type'和'by.y = type'。见'?merge' –