经验布朗方法

大卫·吉布斯

10-1-2015

摘要

该软件包提供了布朗方法的经验适应,这是费舍尔方法的扩展,用于组合相关的p值。这适用于高通量生物实验中常见的高度相关数据集。

在我们提交的相应论文中,我们证明了在给定p值的依赖集时,Fisher方法是有偏的。当应用于相同的数据集时,经验布朗方法提供了更好的空分布和更保守的结果。

简介

为了整合系统生物学中发现的大型和多样化的数据集,通常将来自多个统计测试的p值结合起来。最早的组合独立p值的方法见于Fisher的工作(1)。Brown后来将Fisher的方法扩展到假设p值来自已知协方差矩阵的多元正态分布的情况(2)。在所有组合p值的方法中,Brown最简单地组合了同等加权的相关p值。然而,我们没有使用数值积分,而是使用了来自数据的经验累积分布函数,使我们的方法大大提高了效率,适用于大型组学数据。

使用函数

此函数用于将非独立检验的p值合并为一个统计量。这里有一个简单的例子,给出一个途径,将基因-基因相关性测试结合起来,这个途径被描述为一组基因。CDH4基因被认为在胶质母细胞瘤癌症的发展中很重要,因此进行了相关测试,比较了一系列基因的基因表达与CDH4的表达。然后,将这些相关p值在通路上进行组合,表明通路可能是异常的。

该方法通用性强,使用灵活。

数据(ebmTestData)#首先获取特定途径的基因glypGenes < -通路基因(通路通路= =“glypican 3网络”#然后收集相关测试p值glypPvals < -allPvalspvalue.with.CHD4 [匹配(glypGenes allPvals基因)];#给定通路中基因的表达glypDat < -dat [匹配(glypGenes datV1),2ncol(dat)];#组合p值的调用empiricalBrownsMethoddata_matrix =glypDat,p_values =glypPvals,extra_info =真正的);

参考文献

[1] Fisher, R.A.(1948)问答/#14,《美国统计学家》,2,30 -31。[2] Brown, M.(1975)结合非独立的单边显著性检验的方法,生物计量学,31,987992。[3] Kost J.T.等(2002)结合相关p值,统计和概率字母,60,183190。[4] Whitlock M.C.(2005)结合独立测试的概率:加权z方法优于fisher方法,《进化生物学杂志》,18,1368-1373。[5] Aerts S. et al.(2006)基于基因组数据融合的基因优先级排序,自然生物技术,24,537 - 544。[6] Zaykin D.V.等(2002)结合p值的截断积方法,Genet流行病学,22,170-85。[7]癌症基因组图谱研究网络。(2008)。全面的基因组特征定义了人类胶质母细胞瘤基因和核心通路,自然455,1061-1068。[8] Schaefer C.F.等(2009)途径相互作用数据库,核酸Res. 37, 674-679。