2015-03-13 120 views
1

我写了一个脚本来拟合泊松分布,似乎与使用python的random.poisson生成的数据集很好地工作,但它不适用于我需要适合的数据集。 脚本是:Scipy:泊松拟合不适用于特定的数据集

In [6]: from scipy.misc import factorial 

In [7]: from scipy.optimize import curve_fit 

In [8]: import numpy as np 

In [9]: import matplotlib.pyplot as plt 


In [11]: def poisson(k, lambd): 
    ....:  print(lambd) 
    ....:  return(lambd**k/factorial(k))*np.exp(-lambd) 

数据是:

In [12]: x = [ 0.0036533, 0.00972361, 0.01579392, 0.02186422, 0.02793453, 0.03400484, 0.04007515, 0.04614546, 0.05221577, 0.05828608, 0.06435639, 0.0704267, 0.07649701, 0.08256731, 0.08863762] 

In [13]: y =[ 0.64005518, 0.10825634, 0.05954099, 0.04330254, 0.03383011, 0.02165127, 0.02435768, 0.01623845, 0.01082563, 0.00676602, 0.00947243, 0.00947243, 0.00270641, 0.00405961, 0.00947243] 

In [18]: popt, pcov = curve_fit(poisson, x, y) 

所以,问题是,这个素文字(= 2.82)发现lambd的最佳价值远远高于它应该是。 有人可以帮忙吗? 在此先感谢

回答

2

泊松分布是discrete probability distribution。因此,它不适用于您的变量数组中的非离散(即非整数)数字。

它适用于通过random.poisson提供的随机数据的原因是该数据将是离散的,而不是连续的。

您应该选择continuous的替代分配。

+0

特别是[指数分布](http://en.wikipedia.org/wiki/Exponential_distribution)通常用作泊松分布的连续近似 – 2015-03-14 20:27:42