作者:Martin Morgan (mtmorgan@fredhutch.org.
日期:2015年9月7日
车间大纲

这份文件中的材料要求R.版本3.2和Bioconductor版本3.1.

stopifnot(getRversion()> ='3.2'&& getRversion()<'3.3',Biocinstaller :: Biocversion()> =“3.1”)

差异表达的统计分析deseq2.

  1. 实验设计
  2. 湿式实验室制备
  3. 高吞吐量排序
  4. 结盟
  5. 总结
  6. 统计分析
  7. 理解

更广泛的材料

挑战和解决方案

起点

正常化

错误模型

有限的样本大小

多个测试

工作流程

数据表示

三种信息类型

SummarizedExperiment协调此信息

图书馆(“气道”)数据(气道)气道
## assays(1): counts ## rownames(64102): ENSG00000000003 ENSG00000000005…LRG_98 LRG_99 ## rowRanges metadata column names(0): ## colnames(8): SRR1039508 SRR1039509…SRR1039520 SRR1039521 ## colData names(9): SampleName cell…样本BioSample
实验头主要成分(测定(气道))
# # SRR1039508 SRR1039509 SRR1039512 SRR1039513 SRR1039516 SRR1039517 SRR1039520 # # ENSG00000000003 679 448 873 408 1138 1047 770 # # ENSG00000000005 0 0 0 0 0 0 0 # # ENSG00000000419 467 515 621 365 587 799 417 # # ENSG00000000457 260 211 263 164 245 331 233 55 # # ENSG00000000460 60 40 35 78 63 76 # # ENSG00000000938 0 0 2 0 1 0 0 # # SRR1039521 # #Ensg00000000003 572 ## ensg00000000005 0 ## ensg00000000419 508 ## ensg00000000457 229 ## ensg00000000460 60 ## ensg00000000938 0
colData(气管)
## Dataframe带8行和9列## Samplename Cell Dex Albut Run Avglength实验样本## <因子> <因子> <因子> <因子> <因子> <整数> <因子> <因子> ## SRR1039508 GSM1275862 N61311untrt untrt SRR1039508 126 SRX384345 SRS508568 ## SRR1039509 GSM1275863 N61311 TRT untrt SRR1039509 126 SRX384346 SRS508567 ## SRR1039512 GSM1275866 N052611 untrt untrt SRR1039512 126 SRX384349 SRS508571 ## SRR1039513 GSM1275867 N052611 TRT untrt SRR1039513 87 SRX384350 SRS508572 ## SRR1039516 GSM1275870 N080611 untrt untrt SRR1039516 120 SRX384353 SRS508575## SRR1039517 GSM1275871 N080611 TRT untrt SRR1039517 126 SRX384354 SRS508576 ## SRR1039520 GSM1275874 N061011 untrt untrt SRR1039520 101 SRX384357 SRS508579 ## SRR1039521 GSM1275875 N061011 TRT untrt SRR1039521 98 SRX384358 SRS508580 ##生物样品## <因数> ## SRR1039508 SAMN02422669 ## SRR1039509 SAMN02422675##srr1039512 samn02422678 ## SRR1039513 SAMN02422670 ## SRR1039516 SAMN02422682 ## SRR1039517 SAMN02422673 ## SRR1039520 SAMN02422683 ## SRR1039521 SAMN02422677
Rowranges(航空公司)
## GRANGESLIST长度为64102:## $ ENSG00000000003 ## GRANGES对象具有17范范围和2个元数据列:## SEQNAMES范围股票|EXON_ID EXON_NAME ##    |<整数>  ## [1] x [99883667,99884983]  -  |667145 ENSE001459322 ## [2] X [99885756,99885863]  -  |667146 ENSE00000868868 ## [3] X [99887482,99887565]  -  |667147 ENSE00000401072 ## [4] X [99887538,99887565]  -  |667148 ENSE00001849132 ## [5] x [99888402,99888536]  -  |667149 ENSE00003554016 ## ... ... ... ... ## [13] x [99890555,99890743]  -  |667156 ENSE00003512331 ## [14] X [99891188,99891686]  -  |667158 ENSE00001886883 ## [15] x [99891605,99891803]  -  | 667159 ENSE00001855382 ## [16] X [99891790, 99892101] - | 667160 ENSE00001863395 ## [17] X [99894942, 99894988] - | 667161 ENSE00001828996 ## ## ... ## <64101 more elements> ## ------- ## seqinfo: 722 sequences (1 circular) from an unspecified genome
##例如,协调子集包括dex 'trt'样本气道[,气道$dex == "trt"]
##类:范围ummarizedexperiment ## Dim:64102 4 ##元数据(1):''##测定(1):Counts ## Rownames(64102):ENSG00000000005 ... LRG_98 LRG_99 ## ROWRANGES元数据列名称(0):## Colnames(4):SRR1039509 SRR1039513 SRR1039517 SRR1039517 SRR1039521 ## COLDATA名称(9):SAMPLENAME CELL ...样品生物素
##例如,只保留非零计数的行气道<-气道[rowsum (assay(气道))!= 0,]

DESeq2工作流程

  1. 将实验设计信息添加到SummarizedExperiment

    图书馆(DESEQ2)DDS < -  DESEQDATASET(呼吸道,设计=〜CELL + DEX)
  2. 执行基本的工作流程步骤

    DDS < -  DESQ(DDS)
    估计尺寸因子估计离散度估计基因离散度估计平均-离散度关系估计最终离散度估计拟合模型和测试
    dds
    ##类:DESQDATASET ## DIM:33469 8 ##元数据(1):''##测定(3):MU COOKS ## ROWNAMES(33469):ENSG00000000419 ... ENSG00000000419 ... ENSG00000273493 ## ROWRANGES元数据列名称(46):底座Basevar ......偏差Maxcooks ## Colnames(8):SRR1039508 SRR1039509 ... SRR1039520 SRR1039520 SRR1039521 ## COLDATA名称(10):SAMPLENAME CELL ... BIOSAMPLE SOUDITFACTOR
  3. 提取结果

    RES < - 结果(DDS)RES
    ## log2 fold change (MAP): dex untrt vs trt #### baseemean log2FoldChange lfcSE stat pvalue padj ## <数字> <数字> <数字> <数字> <数字> <数字> ## ENSG00000000003 708.6021697 0.37424998 0.09873107 3.7906000 0.0001502838 0.001287304 ## ENSG00000000419 520.2979006 0.20215550 0.10929899 -1.8495642 0.0643763883 0.197080529## ENSG00000000457 237.1630368 -0.03624826 0.13684258 -0.2648902 0.7910940570 0.914355830 ## ENSG00000000460 57.9326331 0.08523370 0.24654400 0.3457140 0.7295576915 0.883713089 ## ENSG00000000938 0.3180984 0.11555962 0.14630523 0.7898530 0.4296136448 NA ## ... ... ... ... ... ... ... ## ENSG00000273487 8.1632350 -0.56331132 0.3736236 -1.5076976 0.1316319 0.3293588 ## ENSG00000273488 8.5844790 -0.10805538 0.3684853 -0.2932420 0.7693372 0.9032832 ## ENSG00000273489 0.2758994 -0.11282164 0.1424265 -0.7921393 0.4282794 NA ## ENSG00000273492 0.1059784 0.07644378 0.1248627 0.6122225 0.5403906 NA ## ENSG00000273493 0.1061417 0.07628747 0.1250713 0.6099516 0.5418939 NA