内容

1项目概述

1.1关于

Bioconductor:分析和理解高通量基因组数据

包、插图、工作流程

包的安装和使用

1.2关键概念

目标

好几行啊R不得不说

df <- data.frame(x =x, y =y) plot(y ~ x, df) fit <- lm(y ~ x, df) anova(fit)
##方差分析表## ## Response: Y ## Df Sum Sq Mean Sq F value Pr(>F) ## X 1 1001.14 1001.14 1013 < 2.2e-16 *** ##残差998 986.27 0.99 ##—## Signif。编码:0 '***' 0.001 '**' 0.01 '*' 0.05 '。“0.1”1
abline(适合)

类和方法——“S3”

Bioconductor类和方法- " S4 "

1.3高通量序列分析工作流程

  1. 实验设计

  2. 湿法实验室顺序准备(图来自http://rnaseq.uoregon.edu/)

  3. (Illumina)测序(Bentley等,2008,doi: 10.1038 / nature07517)

  4. 对齐
    • 选择匹配任务,例如:Rsubread, Bowtie2有利于ChIPseq,一些形式的RNAseq;BWA, GMAP更适合变量调用
    • 主要输出:对齐读取的BAM文件
    • 最近:kallisto以及类似的程序,产生与转录本对齐的读取表
  5. 减少
    • 例如,RNASeq '计数表'(简单的电子表格),DNASeq称为变量(VCF文件),ChIPSeq峰值(床,假发文件)
  6. 分析
    • 差异表达,峰值识别,…
  7. 理解
    • 生物环境

1.4Bioconductor测序的生态系统

Alt测序系统