0
我只是想保持行的熊猫数据帧满足下列条件:当第二个条件满足时,第一个条件不满足
1)用户应已与之互动的超过X项目 2)项目应已与之互动与超过Y用户
当满足第二个条件,应用这两个条件后,对于某些用户,第一个条件失败。
groupById = df.groupby(['id']).count()
remaining = groupById[groupById.itemId > X]
df2 = df.loc[df.id.isin(remaining.index)]
groupByItem = df2.groupby(['id']).count()
remainingIt = groupByItem[groupByItem.id > Y]
final = df[df.id.isin(remaining.index) & df.itemId.isin(remainingIt.index)]
我无法理解这个递归问题。任何人?
你是如何确定第一条件失败? – EFT
也许当你计算第一个条件,你使用所有的项目(过滤之前),并在你过滤后,你显然有更少的项目,所以第一个条件可能会失败 – Dotan