编辑的所有列的新数据框中:重写了全部询问使用熊猫GROUPBY创建包含父数据帧
我已经写了那的店位置的列表相匹配,而基于医生位置的其他程序列表经度和纬度。
每一个存储单元拥有一个唯一的ID。我想为每个唯一的ID(本例中为单位)找到3行,距离值最小。我希望这些行包含原始df中的所有信息。
使用这种说法,我能找到的单元号与相应的距离,但没有别的。
df.groupby(['unit'])['distance'].nsmallest(3)
实施例原始数据帧
unit store_name distance doctor_name
123 taqueria 0.3 dr. a
123 taqueria 0.35 dr. b
123 taqueria 0.2 dr. c
123 taqueria 0.5 dr. smith
123 taqueria 0.4 dr. q
123 taqueria 0.1 dr. who
456 carniceria 0.5 dr. a
456 carniceria 0.6 dr. b
456 carniceria 0.3 dr. c
456 carniceria 0.1 dr. smith
456 carniceria 0.2 dr. q
456 carniceria 0.05 dr. who
拟输出
unit store_name distance doctor_name
123 taqueria 0.3 dr. a
123 taqueria 0.2 dr. c
123 taqueria 0.1 dr. who
456 carniceria 0.1 dr. smith
456 carniceria 0.2 dr. q
456 carniceria 0.05 dr. who
预期的输出将减少数据帧至由单元
您能否提供样本输入? –
显示原始DF请 –
@ juanpa.arrivillaga梅德-polonskiy在原来的列标题添加。 –