4
我有一个数据帧,看起来像这样:如何让这个循环更有效率?
user1,product1,0
user1,product2,2
user1,product3,1
user1,product4,2
user2,product3,0
user2,product2,2
user3,product4,0
user3,product5,3
数据帧有数百万行。我需要遍历每一行,如果最后一列的值为0,则保留该产品编号,否则将产品编号附加到value = 0的前一产品编号,然后写入新的数据框。
例如,所产生的基质应
user1,product1
user1,product1product2
user1,product1product3
user1,product1product4
user2,product3
user2,product3product2
user3,product4
user3,product4product5
我写了一个for
循环要经过的每一行,和它的作品,但非常非常慢。我如何加快速度?我试图对它进行矢量化,但我不确定是怎么回事,因为我需要检查前一行的值。