mukey cokey hzdept_r hzdepb_r
422927 11090397 0 20
422927 11090397 20 71
422927 11090397 71 152
422927 11090398 0 18
422927 11090398 18 117
422927 11090398 117 152
我想子集上面的数据框,以便只选择第一组的cokey(在本例中为11090397)。当然,由于这是一个样本数据集,因此解决方案需要扩展到这种数据框的更大版本。基于字段的子集数据帧
在这种情况下,所产生的数据集应该是:
mukey cokey hzdept_r hzdepb_r
422927 11090397 0 20
422927 11090397 20 71
422927 11090397 71 152
我一直在使用GROUPBY尝试过,但不知道如何从中选择只有第一个cokey值。
第一个唯一值在第一个值上有优势吗? – cphlewis 2015-03-31 22:35:28
不是真的,它只是从df获取值的另一种方法。 – EdChum 2015-03-31 22:37:01
独特的文档没有指定它维护顺序,tho。 – cphlewis 2015-04-01 00:06:16