2017-10-07 202 views
-1

样本数据:从边缘列表创建直接边缘矩阵

data = { 
    'node1': [1, 1,1, 2,2,5], 
'node2': [8,16,22,5,25,10], 
'weight': [1,1,1,1,1], } 
df = pd.DataFrame(data, columns = ['node1','node2','weight']) 

给出的数据是与指示node 1和第二列的第一列边缘列表显示直接连接到第一个节点的节点。 鉴于是column 1作为node1column 2作为node2和重量的边缘列表。 我想创建一个矩阵,每行代表给定节点的所有直接边。 (每一行都是一个节点,其中的列是给定节点的直接边)使用Pandas Dataframe。

输出:

8 16 22 

5 25 0 

0 0 0 

0 0 0 

10 0 0 
+0

没有行是96000.But我可以解释数据更多,如果你想 –

回答

1

IIUC

df=df.assign(Cu=df.groupby('node1').cumcount()).set_index('Cu').groupby('node1').apply(lambda x : x['node2']*x['weight']).unstack('Cu').fillna(0) 
df 
Out[71]: 
Cu  0  1  2 
node1     
1  8.0 16.0 22.0 
2  5.0 25.0 0.0 
5  10.0 0.0 0.0 

为了救你出去放,你可以reindex + fillna

编辑:请注意你的预期输出contian一些全0行,

df.reindex([1,2,3,4,5]).fillna(0) 
Out[107]: 
Cu  0  1  2 
node1     
1  8.0 16.0 22.0 
2  5.0 25.0 0.0 
3  0.0 0.0 0.0 
4  0.0 0.0 0.0 
5  10.0 0.0 0.0 
+0

你能解释reindex步骤? –

+0

@ChaitaliSarkar检查编辑 – Wen