我有两列“的ID”和“名称”的数据帧DF1提取特定行 -从数据帧
ids names
fhj56 abc
ty67s pqr
yu34o xyz
我有具有某些列是另一个数据帧DF2 -
user values
1 ['fhj56','fg7uy8']
2 ['glao0','rt56yu','re23u']
3 ['fhj56','ty67s','hgjl09']
我的结果应该给我那些来自df2的用户,他们的值至少包含df1中的一个id,并且告诉哪些id负责将它们放入结果表中。结果应该看起来像 -
user values_responsible names
1 ['fhj56'] ['abc']
3 ['fhj56','ty67s'] ['abc','pqr']
用户2不产生表来,因为没有它的价值在DF1存在。
我试图如下做到这一点 -
df2.query('values in @df1.ids')
但是,这似乎并没有很好地工作。
您需要UNNEST你列'values' – Wen