2017-06-20 116 views
2

如何做两个向量可能缺失值的numpy点积?这似乎需要许多额外的步骤,有更简单的方法来做到这一点?:缺失值的numpy点积

v1 = np.array([1,4,2,np.nan,3]) 
v2 = np.array([np.nan,np.nan,2,4,1]) 
np.where(np.isnan(v1),0,v1).dot(np.where(np.isnan(v2),0,v2)) 

回答

3

我们可以使用np.nansum总结忽略逐元素相乘后NaNs值 -

np.nansum(v1*v2) 

样品运行 -

In [109]: v1 
Out[109]: array([ 1., 4., 2., nan, 3.]) 

In [110]: v2 
Out[110]: array([ nan, nan, 2., 4., 1.]) 

In [111]: np.where(np.isnan(v1),0,v1).dot(np.where(np.isnan(v2),0,v2)) 
Out[111]: 7.0 

In [115]: v1*v2 
Out[115]: array([ nan, nan, 4., nan, 3.]) 

In [116]: np.nansum(v1*v2) 
Out[116]: 7.0 
+0

虽然我在传递熊猫系列时遇到以下错误,但我没有得到我的答案:TypeError:'Series'对象无法解释作为一个整数' –

+0

@AllenWang添加样品熊猫系列成问题? – Divakar

+0

Nvm,我认为这是一个错字 –