我对R相对较新,并且努力在R中“矢量化”所有代码。尽管我很欣赏这是正确的方法。将观察值设置为R中该观察值的最小值
我需要在数据框中设置一个值作为ID的最小时间。以下作品完美
ID isTrue RealTime MinTime
1 TRUE 16 10
1 FALSE 8
1 TRUE 10 10
2 TRUE 7 7
2 TRUE 30 7
3 FALSE 3
:
ID isTrue RealTime MinTime
1 TRUE 16
1 FALSE 8
1 TRUE 10
2 TRUE 7
2 TRUE 30
3 FALSE 3
要变成。然而,这需要10分钟跑,这是不理想的:
for (i in 1:nrow(df)){
if (df[i,'isTrue']) {
prevTime <- sqldf(paste('Select min(MinTime) from dfStageIV where ID =',df[i,'ID'],sep=" "))[1,1]
if (is.na(prevTime) | is.na(df[i,'MinTime']) | df[i,'MinTime'] < prevTime){
df[i,'MinTime']<-dfStageIV[i,'RealTime']
} else {
dfStageIV[i,'MinTime']<-prevTime
}
}
}
我应该如何正确地做到这一点?我把它用于或做循环不是在R最好的方式。我一直在看apply()和aggregate.data.frame()函数,但不知道如何做到这一点。有人能指引我朝着正确的方向吗?非常感激!!
看看'ave'。 – lmo
谢谢,第一次尝试是接近。 df $ MinTime <-ave(df $ RealTime,df $ ID,FUN = min)。但是,我怎样才能让它取得那些isTrue = TRUE的呢? – user2535309
df $ MinTime <-ave(df $ RealTime,df $ ID,df $ isTrue,FUN = min) df $ MinTime <-ifelse(df $ isTrue,df $ MinTime,NA)。这会返回一大堆警告,但会起作用。谢谢! – user2535309