Bioconductor:分析和理解高通量基因组数据
包、插图、工作流程
包的安装和使用
一个包需要安装一次,使用包登陆页上的说明(例如,DESeq2)。
源(“//www.andersvercelli.com/biocLite.R”)biocLite (c(“DESeq2”、“org.Hs.eg.db”))
biocLite ()
安装Bioconductor,凹口和github包。
安装后,可以将包加载到R会话中
库(GenomicRanges)
帮助系统交互式查询,如上所述:
帮助(package="GenomicRanges") vignette(package="GenomicRanges") vignette(package=" genomics ranges ", "GenomicRangesHOWTOs")
目标
好几行啊R不得不说
df <- data.frame(x =x, y =y) plot(y ~ x, df) fit <- lm(y ~ x, df) anova(fit)
##方差分析表## ## Response: Y ## Df Sum Sq Mean Sq F value Pr(>F) ## X 1 1001.14 1001.14 1013 < 2.2e-16 *** ##残差998 986.27 0.99 ##—## Signif。编码:0 '***' 0.001 '**' 0.01 '*' 0.05 '。“0.1”1
abline(适合)
类和方法——“S3”
data.frame ()
创建一个实例或对象
图()
,lm ()
,方差分析()
,abline ()
:方法上定义泛型将实例
发现和帮助
class(fit)方法(class=class(fit))方法(plot)
选项卡完成!
Bioconductor类和方法- " S4 "
例如:处理DNA序列
dna <- DNAStringSet(c("AACAT", "GGCGCCT")) reverseComplement(dna)
## ## [1] 5 ATGTT ## [2] 7 AGGCGCC
数据(phiX174Phage) phiX174Phage
## A DNAStringSet instance of length 6 ## width seq names ## [1] 5386 GAGTTTTATCGCTTCCATGACGCAGAAGTTAAC…TTCGATAAAAATGATTGGCGTATCCAACCTGCA Genbank ## [2] 5386 gagttttatcgcttatgcagaagttaac…TTCGATAAAAATGATTGGCGTATCCAACCTGCA rf70 ## [3] 5386 gagttatcgcttatgcagaagttaac…TTCGATAAAAATGATTGGCGTATCCAACCTGCA SS78 ## [4] 5386 gagttatcgcttatgcagaagttaac…TTCGATAAAAATGATTGGCGTATCCAACCTGCA Bull ## [5] 5386TTCGATAAAAATGATTGGCGTATCCAACCTGCA G97 ## [6] 5386TTCGATAAAAATGATTGGCGTATCCAACCTGCA NEB03
letterFrequency (phiX174Phage GC, as.prob = TRUE)
# # G | C # # # # 0.4476420 [1] [2] 0.4472707 # # # # 0.4472707 [3] [4] 0.4470850 # # # # 0.4472707 [5] [6] 0.4470850
发现和帮助
类(dna) ?“DNAStringSet-class”?“reverseComplement DNAStringSet-method”
实验设计
湿法实验室顺序准备(图来自http://rnaseq.uoregon.edu/)
(Illumina)测序(Bentley等,2008,doi: 10.1038 / nature07517)