2013-04-10 82 views
4

简而言之:有一个similar question,最好的答案建议使用numpy.bincount。我需要同样的东西,但对于矩阵。给定矩阵中的指数增量

我有两个数组:

array([1, 2, 1, 1, 2]) 
array([2, 1, 1, 1, 1]) 

他们一起做应该增加指数:

>>> np.array([a, b]).T 
array([[1, 2], 
     [2, 1], 
     [1, 1], 
     [1, 1], 
     [2, 1]]) 

我想这个矩阵:

array([[0, 0, 0], 
     [0, 2, 1], # (1,1) twice, (1,2) once 
     [0, 2, 0]]) # (2,1) twice 

矩阵将会很小(如5×5),并且指数的数量会很大(大约在10^3或10^5之间)。

那么,有没有比for -loop更好的(更快)?

回答

3

您仍然可以使用bincount()。诀窍是将ab转换为单个平面索引的一维数组。

如果矩阵是n x m,您可以将bincount()应用于a * m + b,并从结果中构造矩阵。

举的例子在你的问题:

In [15]: a = np.array([1, 2, 1, 1, 2]) 

In [16]: b = np.array([2, 1, 1, 1, 1]) 

In [17]: cnt = np.bincount(a * 3 + b) 

In [18]: cnt.resize((3, 3)) 

In [19]: cnt 
Out[19]: 
array([[0, 0, 0], 
     [0, 2, 1], 
     [0, 2, 0]]) 

如果数组的形状比较复杂,它可能是更容易使用np.ravel_multi_index()代替手工计算平指数:

In [20]: cnt = np.bincount(np.ravel_multi_index(np.vstack((a, b)), (3, 3))) 

In [21]: np.resize(cnt, (3, 3)) 
Out[21]: 
array([[0, 0, 0], 
     [0, 2, 1], 
     [0, 2, 0]]) 

(帽尖@Jaime指出ravel_multi_index。)

+0

太棒了,谢谢! – kirelagin 2013-04-10 09:21:15

+3

+1非常好。 ['np.ravel_multi_index'](http://docs.scipy.org/doc/numpy/reference/generated/numpy.ravel_multi_index.html)可能会派上用场,避免用更复杂的数组思考太多。 – Jaime 2013-04-10 16:13:52

+0

@Jaime:太棒了,谢谢你的指针。我正在寻找'ravel_multi_index'之类的东西,但没有找到它。 – NPE 2013-04-10 16:14:40

2
m1 = m.view(numpy.ndarray) # Create view 
m1.shape = -1 # Make one-dimensional array 
m1 += np.bincount(a+m.shape[1]*b, minlength=m1.size)