1
我有一个大的DataFrame(〜1 Milion行),我需要删除一些基于唯一标识符Trade_Id的行。我在另一个名为tib的DataFrame变量中包含这行(在我的测试数据库上是45000)的内容。我的做法是这样的一个删除包含数组内容的熊猫DataFrame行
lentib=len(tib)
for i in range(0,lentib,1): # VERY SLOW
dat=dat[dat.Trade_Id!=tib.Trade_Id[i]]
但问题是,这是很慢的,做dat[dat.Trade_Id!=tib.Trade_Id]
不起作用。
有人有更好的主意,以便更有效地计算?我有这样的其他数据库可以使用,我不想两天就可以计算出来。
哦,谢谢!我确信有一些更有效的方法,但我无法找到它。它工作速度非常快。 – VCLL