2013-05-07 94 views
-1

我已经使用自引导来推导出空分布,估计了Tajima'D D值数据集的置信区间(CI)。我想调整这些CI来解释使用BY过程的错误发现率(FDR),因为这样可以使数据点不是独立的。我已经可以为与R包p.adjust中的每个数据点相关联的单个p值执行此操作。但是,我宁愿修改整个数据集的置信区间,但是,而不是针对每个单独的p值。 (这样做会使绘制图表中重要和非重要值的速度更快)。有没有人知道一个很好的计划,以便在BH阶段调整FDR的置信区间?

有谁知道可以做到这一点的程序(最好用R或Python编写)?

BY FDR详细信息: Benjamini和Yekutieli(2005)。虚假发现率 - 为所选参数调整多个置信区间。 Journal of the American Statistical Association,100(469)。

Benjamini和Yekutieli(2001)。依赖性下多重检验中虚假发现率的控制。统计年鉴29,1165-1188

+0

问题更适合http://stats.stackexchange.com/或http://biology.stackexchange.com/ – harkmug 2013-05-07 18:33:47

回答

1

请看R stats包中的(默认安装和加载)。有多种调整方法,包括一个名为“BY”的调整方法,它与您引用的作者具有相同的2001年引文。我想你应该检查2005年和2001年论文中的方法是否相同。由于p值可以“倒置”以产生CDF位置或标准错误值,因此您应该能够使用该函数中随时可用的代码,该代码将显示在控制台会话中:

p.adjust 

...然后拼凑一个CI,用于任何你正在按摩的样本统计量。

+0

p.adjust会修改单个p值,但似乎没有调整切割的选项-off values ... – gwilymh 2013-06-21 19:47:04

+0

“调整截止值”是a)在没有代码的情况下不是非常具体,b)不是在问题中提到的东西。您应该发布一个示例,使您的问题规范更具体。 – 2013-06-21 19:52:25

相关问题