用户!2014
作者:Martin Morgan (mtmorgan@fhcrc.org), Sonali Arora
日期:2014年6月30日
用于统计计算和图形的语言和环境
因素()
,NA
向量、类对象
逻辑
,整数
,数字
,复杂的
,字符
,字节
矩阵
-带有“dim”属性的原子向量data.frame
-长度相等的原子向量列表lm ()
,低于函数、泛型方法
rnorm (1000)
print ()
。print.factor
;方法调用间接,通过通用。自省
类()
,str ()
昏暗的()
帮助
?打印
:帮助通用打印print.data.frame ?
:关于类data.frame对象打印方法的帮助。例子
df <- data.frame(x=x, y=y) # object of class 'data.frame' plot(y ~ x, df) # generic plot, method plot.formula . df (x ~ x, df
fit <- lm(y ~x, df) # class 'lm'方法的对象(class=class(fit)) #内省
# # [1] add1。lm *别名。lm *方差分析。lm* ## [4] case.names.lm* confint。lm cooks.distance。lm* ##[7]异常。lm * dfbeta。lm * dfbetas。lm* ## [10] drop p1。lm * dummy.coef.lm效果。lm* ##[13]萃取。lm *家庭。lm *公式。lm* ##[16]值。lm *的影响。lm *卡帕。lm ##[19]标签。lm * logLik。lm* model.frame.lm* ## [22] model.matrix.lm nobs。lm *情节。lm* ## [25] predict.lm print.lm* proj.lm* ## [28] qr.lm* residuals.lm rstandard.lm* ## [31] rstudent.lm* simulate.lm* summary.lm ## [34] variable.names.lm* vcov.lm* ## ## Non-visible functions are asterisked
分析和理解高通量基因组数据
包、插图、工作流程
对象
getClass ()
,showMethods(…,where=search())
,selectMethod ()
方法?“字符串的子串,<选项卡>”
要选择关于方法的帮助,课吗?D <选项卡>
课堂求助例子
require(Biostrings) # biosequences data(phiX174Phage) # sample data, see
## A DNAStringSet instance of length 6 ## width seq names ## [1] 5386 GAGTTTTATCGCTTCCATGAC…ATTGGCGTATCCAACCTGCA Genbank ## [2] 5386 GAGTTTTATCGCTTCCATGAC…ATTGGCGTATCCAACCTGCA RF70s ## [3] 5386 GAGTTTTATCGCTTCCATGAC…ATTGGCGTATCCAACCTGCA SS78 ## [4] 5386 gagttttcgcttccatgac…ATTGGCGTATCCAACCTGCA Bull ## [5] 5386 gagttttcgcttccatgac…ATTGGCGTATCCAACCTGCA G97 ## [6] 5386 GAGTTTTATCGCTTCCATGAC…ATTGGCGTATCCAACCTGCA NEB03
m <-共识矩阵(phix174噬菌体)[1:4,]#细胞核。x位置计数多态性<- which(colsum (m != 0) > 1) m[,多态性]
# # [1] [2] [3] [4] [5] [6] [7] [8] [9] # # 4 5 4 3 0 0 5 2 0 # # C 0 0 0 0 5 1 0 0 5 # # G 2 1 2 3 0 0 1 4 0 # # T 0 0 0 0 1 5 0 0 1
showMethods(类类(phiX174Phage) =, =搜索())
锻炼
装饰图案(包=“Biostrings”)
。函数中添加另一个参数装饰图案
函数查看“BiostringsQuickOverview”小插图。下面的代码加载一些示例数据,作为DNAStringSet对象加载6个版本的phix174噬菌体基因组。
库(Biostrings)数据(phiX174Phage)
解释下面的代码是做什么的,以及它是如何工作的
m <- consensusMatrix(phix174噬菌体)[1:4,]多态性<- which(colsum (m != 0) > 1)
# #[1][2][3][4][5][6][7][8][9] # #基因库“G”“G”“”“”“C”“C”“A”“G”“C”# # RF70s“”“”“”“G”“C”“T”“A”“G”“C”# # SS78“”“”“”“G”“C”“T”“A”“G”“C”# #牛“G”“A”“G”“A”“C”“T”“”“”“T”# # G97“A”“A”“G”“A”“C”“T”“G”“A”“C”# # NEB03“”“”“”“G”“T”“T”“A”“G”“C”
Bioconductor是一个大的R包集合,用于分析和理解高通量基因组数据。Bioconductor依赖正式的类来表示基因组数据,所以对类有一个基本的理解是很重要的,包括寻求类和方法的帮助。Bioconductor使用小插图来增加传统的帮助页面;这些在说明整个包的使用方面非常有价值。