2015-10-29 28 views
-1

我有以下数据集:MATLAB中的归一化直方图不正确?

X=[4.692 
    6.328 
    4.677 
    6.836 
    5.032 
    5.269 
    5.732 
    5.083 
    4.772 
    4.659 
    4.564 
    5.627 
    4.959 
    4.631 
    6.407 
    4.747 
    4.920 
    4.771 
    5.308 
    5.200 
    5.242 
    4.738 
    4.758 
    4.725 
    4.808 
    4.618 
    4.638 
    7.829 
    7.702 
    4.659]; % Sample set 

我嵌合的Pareto分布此使用最大似然方法和我得到下面的图:

enter image description here

在哪里的以下位代码是什么绘制直方图:

[N,edges,bin] = histcounts(X,'BinMethod','auto'); 
bin_middles=mean([edges(1:end-1);edges(2:end)]); 
f_X_sample=N/trapz(bin_middles,N); 
bar(bin_middles,f_X_sample,1);; 

我正在做这个权利?我检查了100次,帕累托分布确实是最佳的,但它似乎与直方图有很大的不同。有没有可能导致此错误?谢谢!

+2

尝试手动增加仓的数量,而不是使用'auto'标志 – tashuhka

+0

好,会在我的电脑试试这个。虽然你的建议不是“人造”的吗? –

回答

1

我会@ tashuhka的评论,你需要想想你如何装箱的数据相一致。

想象的极端情况下,你都混为一谈连成一片纸槽,然后尝试在单点适合的分布。你的PDF看起来不像你的单个方形条。分成两个箱,现在依然适合很烂,但至少有一个酒吧(可能)比其他的,等等,等等。大一点在另一个极端,每一个数据点拥有自己的酒吧和条形图只有一个点数的酒吧随机森林。

有用于choosing an "optimal" bin size最小化窗口的数量,但最大化底层PDF的表示了一些不同的策略。

最后要注意,你只有30点在这里,所以你的其他问题可能是,你只是还没有收集到足够的数据,真正敲定底层PDF。

+0

箱数越来越多,谢谢! –