我必须分析经济实验中的数据。 因此,我有一个数据库(14 976 obs),我分为两部分:卖方的类型为1(7488 obs),另一个为类型2(7488 obs)的买方,每个数据库中有212个变量。如果一行上的值匹配,则进行条件替换
在这里,你有这两个数据库的一部分:
sellers
ID Gender Period Matching group Group Type Overcharging ...
654 1 1 73 1 1 NA
654 1 2 73 1 1 NA
654 1 3 73 1 1 NA
654 1 4 73 1 1 NA
435 1 1 73 2 1 NA
435 1 2 73 2 1 NA
435 1 3 73 2 1 NA
435 1 4 73 2 1 NA
buyers
ID Gender Period Matching group Group Type Overcharging ...
708 0 1 73 1 2 1
708 0 2 73 1 2 0
708 0 3 73 1 2 0
708 0 4 73 1 2 1
546 1 1 73 2 2 0
546 1 2 73 2 2 0
546 1 3 73 2 2 1
546 1 4 73 2 2 0
我有很多变量,如过充一个地方放于买家行,其中并没有在那些卖家信息。所以我想要做的是在卖家数据库中替换这些信息。
对此,我有很多信息: 在匹配组73中,我们知道例如在第一阶段,主题708被多收(第一组中的一个)。据我所知,这些男子属于第1组和第73组,因此我可以确定在第一阶段多收费的卖方:性别为1的第654项。
所以,我想在卖家数据框上多收取(和其他一些)买家的价值来分析卖家的行为,但是在正确的时期,对于正确的组和正确的匹配组。
谢谢!帮助表示赞赏...
谢谢你的回答,但是我试过你的解决方案,它不起作用。它创建了比我原始数据库更多的观察数据... – Marc
可能您在'买家'数据框中为'Period,Matching_group,Group'组合组合了多个记录。你可以通过'library(dplyr)来确认。买家%>%group_by(Period,Matching_group,Group)%>%summarize(n = n())%>%filter(n> 1)' – Prem