1
我有一个大型数据集(> 100,000个行),并且希望创建一个新列,用于总计另一列的所有先前值。有效地总结大列中的所有以前的行
对于模拟数据集test.data
10万行2列,我创建与总结第2列的内容的新载体:
sapply(1:100000, function(x) sum(test.data[1:x[1],2]))
我追加这个载体的test.table
与cbind()
这是后然而,太慢了。有没有更快的方法来完成这个任务,或者能够引用sapply在sapply中创建的向量,以便我可以更新累积和而不是再次执行整个calc?
你尝试合并() – user2510479
您是否考虑过直接创建它使用cumsum? –
像'test.data $ sum < - cumsum(test.data [,2])''? –