2017-04-12 59 views
0

我想统计numpy数组中特定值(在本例中为-1)的出现次数,并同时删除它们。计算特定值的出现次数并同时将它们删除

我能做到这一点所以这里是我做了什么:

a = np.array([1, 2, 0, -1, 3, -1, -1]) 
b = a[a==-1] 
a = np.delete(a, np.where(a==-1)) 
print("a -> ", a) # a -> [1 2 0 3] 
print("b -> ", b) # b -> 3 

有没有更优化的方式做到这一点?

+3

计数在你的代码中发生了什么?删除'-1'就是:'a [a!= - 1]'? – Divakar

+1

@Divakar我想,OP想要在原地修改数组'a'。 – kmario23

回答

-1

这样的事情? 尽管像你一样使用numpy可能会更优化。

a = [x for x in a if x != -1] 
-1

首先,列表就地数和删除操作:

In [100]: al=a.tolist(); cnt=0 
In [101]: for i in range(len(a)-1,-1,-1): 
    ...:  if al[i]==-1: 
    ...:   del al[i] 
    ...:   cnt += 1 

In [102]: al 
Out[102]: [1, 2, 0, 3] 
In [103]: cnt 
Out[103]: 3 

它工作在地方,但必须从工作进行到底。列表理解选项创建了一个新列表,但通常更容易编写和阅读。

最干净的数组操作使用布尔值掩码。

In [104]: idx = a==-1 
In [105]: idx 
Out[105]: array([False, False, False, True, False, True, True], dtype=bool) 
In [106]: np.sum(idx) # or np.count_nonzero(idx) 
Out[106]: 3 
In [107]: a[~idx] 
Out[107]: array([1, 2, 0, 3]) 

您必须以某种方式或其他方式识别与目标匹配的所有元素。计数是一项微不足道的操作。掩蔽也很容易。

np.delete必须告知要删除的项目;并以某种方式或其他构造一个新的数组,其中包含除'删除'之外的所有数据。由于它的普遍性,它几乎总是比这种掩蔽的直接行动慢。

np.where(又名np.nonzeros)使用count_nonzero来确定它将返回多少个值。

所以我提出了和你一样的行动,但是以更直接的方式。