我是新来的大熊猫,并想分析安排这样一些数据:表列的Python +熊猫
label aa bb
index
0 [2, 5, 1, 4] [x1, x2, y1, z1]
1 [3, 3, 19] [x3, x4, y2]
2 [6, 4, 2, 8, 9, 10] [y1, y2, z3, z4, x1, w]
其中X1,X2,X3,X4是M型的; y1,y2是N型; z1,z2,z3,z4的类型为O.请注意,data [2,'bb']是w,它不属于任何类型。这种关系在MongoDB中定义如下
{'_id' : ObjectId(x1), type : 'M'}
{'_id' : ObjectId(y1), type : 'N'}
{'_id' : ObjectId(z1), type : 'O'}...
db.data.find({'_id' : ObjectId(w)}) is null
所需的输出会是这样的:
label sum_M sum_N sum_O
index
0 7 1 4
1 6 19 0
2 9 10 10
有谁知道如何与大熊猫做到这一点?
你能提供生成示例数据的代码?目前尚不清楚您的数据实际是什么,因此很难提供如何执行您所需要的操作说明。 –
示例Dataframe是从mongodb文档列表生成的,格式为'{_id:id,amount:[2,5,1,4],numbering:[x1,x2,y1,z1]}' pandas.DataFrame(list(collection.find({}))' – Philip