我有一个相当容易理解的问题。转换数据以适合正态分布
我有一组数据,我想估计这个数据有多好,符合标准正态分布。要做到这一点,我开始与我的代码:
[f_p,m_p] = hist(data,128);
f_p = f_p/trapz(m_p,f_p);
x_th = min(data):.001:max(data);
y_th = normpdf(x_th,0,1);
figure(1)
bar(m_p,f_p)
hold on
plot(x_th,y_th,'r','LineWidth',2.5)
grid on
hold off
图1看起来像下面这样:
不难发现,配合相当差,altough的钟形状可以被发现。主要问题在于我的数据差异。
要找出occurrances适当数量的我的数据箱应该自己,我这样做:
f_p_th = interp1(x_th,y_th,m_p,'spline','extrap');
figure(2)
bar(m_p,f_p_th)
hold on
plot(x_th,y_th,'r','LineWidth',2.5)
grid on
hold off
这将导致如下图。 :
因此,问题是:我怎么能扩展我的数据块以匹配高斯分布在图2 ?
注意
我想强调的重点一点:我不想找到的最好分布拟合数据; 问题是颠倒:从我的数据开始,我想操纵它,最终它的分布合理地符合高斯函数。
不幸的是,目前,我还没有真正的想法如何执行这个数据“过滤器”,“变换”或“操纵”。
任何支持将受到欢迎。
如何为这个问题从以前的最后两个问题有什么不同([这](http://stackoverflow.com/questions/15496804/manipulate -data-to-better-fit-a-gaussian-distribution)和[this](http://stackoverflow.com/questions/15473064/fit-data-to-normal-distribution))? – 2013-03-21 14:13:21
到目前为止我还没有得到任何有价值的答案!所以我试图调整这个问题以使它更易于读者阅读。 – fpe 2013-03-21 14:17:19
我认为最好的办法是通过_editing_,而不是发布新的问题。但那只是我的看法,当然。 – 2013-03-21 14:18:34