2017-09-15 74 views
3

分开我的数据帧的象限考虑我的数据框df我怎样才能通过零

df = pd.DataFrame(np.ones((4, 4), dtype=int), list('ABDE'), list('VWYZ')) 

df 

    V W Y Z 
A 1 1 1 1 
B 1 1 1 1 
D 1 1 1 1 
E 1 1 1 1 

我怎样才能用零

V W X Y Z 
A 1 1 0 1 1 
B 1 1 0 1 1 
C 0 0 0 0 0 
D 1 1 0 1 1 
E 1 1 0 1 1 
+0

所以,没有。 cols和rows总是偶数? – Divakar

+0

我怎么知道你**会问这个问题?是!但我的解决方案并不需要它。 – piRSquared

+0

你知道伟大的思想..和他们对这些说什么;) – Divakar

回答

1

创建新的索引和列值,然后reindex

a = int(len(df.columns)/2) 
cols =np.concatenate([df.columns[:a], ['X'], df.columns[a:]]) 
b = int(len(df.index)/2) 
idx =np.concatenate([df.index[:b], ['C'], df.index[b:]]) 

df = df.reindex(index=idx, columns=cols, fill_value=0) 
print (df) 
    V W X Y Z 
A 1 1 0 1 1 
B 1 1 0 1 1 
C 0 0 0 0 0 
D 1 1 0 1 1 
E 1 1 0 1 1 
+1

就是这样!这个'f = lambda x,i:list(x [:len(x)// 2])+ [i] + list(x [len(x)// 2:])的派生函数。 df.reindex(f(df.index,'C'),f(df.columns,'X'),fill_value = 0)' – piRSquared

+0

Wau,谢谢。 – jezrael

+1

为什么不使用'insert'而不是'f'? – Zero

3
df['X'] = 0 
df.loc['C'] = [0]*len(df.columns) 
df = df.sort_index() 
df = df[[sorted(df.columns)]] 

我的数据框的象限分开,如果我不能分类标签,然后:

df['X'] = 0 
col = list(df.columns) 
col.insert(len(col)/2,'X') 
df = df[col[:-1]] 
df.loc['C'] = 0 
rows = list(df.index) 
rows.insert(len(df)/2,'C') 
df.reindex(rows[:-1]) 
+1

自我解释,但你滥用这里的示例数据的结构,我不认为这值得它的票数。 –

+0

@cᴏʟᴅsᴘᴇᴇᴅ是正确的。标签可能已经完全不同。 – piRSquared

+0

用另一种方法编辑,但没那么高雅 –

4

一种丑陋的方式将

In [860]: df.insert(df.shape[1]/2, 'X', 0) 

In [861]: df.reindex(df.index.insert(df.shape[0]/2, 'C'), fill_value=0) 
Out[861]: 
    V W X Y Z 
A 1 1 0 1 1 
B 1 1 0 1 1 
C 0 0 0 0 0 
D 1 1 0 1 1 
E 1 1 0 1 1 

,从另一个灵感Divarkar的

In [897]: df.reindex(index=df.index.insert(df.shape[0]/2, 'C'), 
        columns=df.columns.insert(df.shape[1]/2, 'X'), fill_value=0) 
Out[897]: 
    V W X Y Z 
A 1 1 0 1 1 
B 1 1 0 1 1 
C 0 0 0 0 0 
D 1 1 0 1 1 
E 1 1 0 1 1 
+0

这在哲学上与我想的是一样的。重新索引时,我使用了'fill_value = 0'参数。 – piRSquared

+0

关于排序...是的,确切地说。 – piRSquared

+0

同意!接受@jezrael,因为我首先看到了索引和列的'reindex'。 – piRSquared

2

下面是一个使用数组创建的地方电网与np.ix_被插入 -

a = df.values 
m,n = a.shape 
mask_row = np.r_[:m//2+1,m//2-1:-1:-1] < m//2 
mask_col = np.r_[:n//2+1,n//2-1:-1:-1] < n//2 

out = np.zeros((m+1,n+1), dtype=a.dtype) 
out[np.ix_(mask_row, mask_col)] = a 
df_out = pd.DataFrame(out) 
df_out.columns = np.insert(df.columns, n//2, 'New') 
df_out.index = np.insert(df.index, m//2, 'New') 

取样输出 -

In [375]: df_out 
Out[375]: 
    V W New Y Z 
A 1 1 0 1 1 
B 1 1 0 1 1 
New 0 0 0 0 0 
D 1 1 0 1 1 
E 1 1 0 1 1 
+0

你是否建议mask比out = np.zeros((m + 1,n + 1),dtype = a.dtype)更好; out [m // 2] = 1; out [:, m // 2] = 1'? – Zero

+0

@JohnGalt你不需要需要四个这样的切片分配步骤吗? – Divakar

+0

为什么四个,两个会做。这三条线足以产生最终的交叉数组。 – Zero