经验布朗方法

摘要

该软件包提供了布朗方法的经验适应，这是费舍尔方法的扩展，用于组合相关的p值。这适用于高通量生物实验中常见的高度相关数据集。

在我们提交的相应论文中，我们证明了在给定p值的依赖集时，Fisher方法是有偏的。当应用于相同的数据集时，经验布朗方法提供了更好的空分布和更保守的结果。

简介

为了整合系统生物学中发现的大型和多样化的数据集，通常将来自多个统计测试的p值结合起来。最早的组合独立p值的方法见于Fisher的工作(1)。Brown后来将Fisher的方法扩展到假设p值来自已知协方差矩阵的多元正态分布的情况(2)。在所有组合p值的方法中，Brown最简单地组合了同等加权的相关p值。然而，我们没有使用数值积分，而是使用了来自数据的经验累积分布函数，使我们的方法大大提高了效率，适用于大型组学数据。

使用函数

此函数用于将非独立检验的p值合并为一个统计量。这里有一个简单的例子，给出一个途径，将基因-基因相关性测试结合起来，这个途径被描述为一组基因。CDH4基因被认为在胶质母细胞瘤癌症的发展中很重要，因此进行了相关测试，比较了一系列基因的基因表达与CDH4的表达。然后，将这些相关p值在通路上进行组合，表明通路可能是异常的。

该方法通用性强，使用灵活。

数据(ebmTestData)#首先获取特定途径的基因glypGenes < -通路＄基因(通路＄通路= =“glypican 3网络”］#然后收集相关测试p值glypPvals < -allPvals＄pvalue.with.CHD4 [匹配(glypGenes allPvals＄基因)];#给定通路中基因的表达glypDat < -dat [匹配(glypGenes dat＄V1),2：ncol(dat)];#组合p值的调用empiricalBrownsMethod（data_matrix =glypDat,p_values =glypPvals,extra_info =真正的）;

参考文献

[1] Fisher, R.A.(1948)问答/#14，《美国统计学家》，2,30 -31。[2] Brown, M.(1975)结合非独立的单边显著性检验的方法，生物计量学，31,987992。[3] Kost J.T.等(2002)结合相关p值，统计和概率字母，60,183190。[4] Whitlock M.C.(2005)结合独立测试的概率:加权z方法优于fisher方法，《进化生物学杂志》，18,1368-1373。[5] Aerts S. et al.(2006)基于基因组数据融合的基因优先级排序，自然生物技术，24,537 - 544。[6] Zaykin D.V.等(2002)结合p值的截断积方法，Genet流行病学，22,170-85。[7]癌症基因组图谱研究网络。(2008)。全面的基因组特征定义了人类胶质母细胞瘤基因和核心通路，自然455,1061-1068。[8] Schaefer C.F.等(2009)途径相互作用数据库，核酸Res. 37, 674-679。

大卫·吉布斯

10-1-2015

摘要

简介

使用函数

参考文献