---标题:“免疫概念介绍,BioC 2016”作者:renan sauteraud日期:renan sauteraud日期:2016年6月25日autosize:true输出:html_document:toc:true toc_float:true gignette:>%\ vignetteengine {knitr :: Rarkdown}%\VigneteIndexEntry {免疫概述}Fig.Width = 10)```#用例:流感的系统生物学的发表结果。**人类季节性流感疫苗接种的系统生物学**。nakaya等人(2011)。本文采用了系统生物学方法研究了三个赛季中对甲型流感的疫苗接种的免疫应答。与TIV接种疫苗的两个队列(2007年和2008年)。和Laiv(2008年)。
#在没有免疫空间##从Geo获取数据,在发布后在Geo上提供数据。[superseries](http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=gse29619)在纸上引用。````{r useecase} gseber(geoquery)gse < - getgeo(“gse29619”)```返回的对象是3`hexpressionset`s的lapt`。每个包裹/队列。````{r} gse```不能在不寻找物体的情况下识别季节。````{r}名称(gse)`````````````````````{r}库(biobase)es_laiv < - gse [[1]] head(pdata(es_laiv),,permodata3)```###问题*元数据形成不佳*主题ID和访问在同一列中*使用“特征_CH1”列映射*没有人口统计数据(年龄,性别,种族)*没有映射到其他数据集(ELISA,ELISPOT,FLOW,GE等......)##组合数据而无需任何其他信息,无法组合各个季节。```{r combine-es,error = true}组合(gse [[1]],gse [[2]])```平台是不同的accross季节。##摘要为了做一些简单的差异基因表达分析分析:*解析每个`的表达式的PerPodata,用于访问和患者ID *使用`incotate`将探针映射到基因*`Combine`成一个表达矩阵*运行dgea(利马)将此信息与另一个数据集相结合,需要额外的数据清洁(假设ID是一致的accros实验)。
#与免疫信徒进行本研究由HIPC提供资金。因此,所有数据都是通过[Immport](http://www.immport.org/immport-open/public/home/home)来策划和标准化的,现在可以在免疫空间上公开提供。我们将使用免疫信徒检索基因表达数据和相关元数据。##连接到免疫空间,研究SDY269拥有2008年的2008年队列,LAIV和TIV的数据。
![](/ home / rsautera / picture / immunespace / sdy269.png)
免疫空间上的研究概述页面

首先,我们实例化与兴趣研究的联系。````{R createConnection269}库(免疫信用仪)SDY269 < - CreateConnection(“SDY269”)SDY269`````hab返回的`免疫缺省数据集显示可用于所选研究的可用数据集和表达式矩阵。免疫信封使用参考类或`R5`。函数是对象的成员,因此$语义在以下样本中访问成员函数。##下载基因表达式```{r getgem_tiv2008} tiv2008 < - sdy269 $ getgematrix(“tiv_2008”)tiv2008```````````````````````只显示基本信息permodata,##我必须为每个队列做到这一点吗?`getGematrix`接受多个ID作为输入。另外设置`摘要= true`将矩阵返回基因平均的表达值。允许轻松合并两个ExpressIpset。```{r getgem_multicohorts} es269 < - sdy269 $ getgematrix(c(“tiv_2008”,“laiv_2008”),摘要= true)ES269“”“为方便起见,也可以通过名称下载队列。 ```{r getGEM_cohortnames} es269 <- sdy269$getGEMatrix(cohort = c("TIV Group 2008", "LAIV group 2008"), summary = TRUE) ``` ## Do I have to do this for every study? SDY269 only contains the two cohorts asociated with the 2008 season but the GEO SuperSeries had three cohorts. The data has been split between multiple studies. SDY61 contains the data for the 2007 season. We have to combine the gene-expression results accross these two studies to get the data that was used in the publication. In order to query multiple studies, we can instantiate a connection to all studies at once. ```{r} all <- CreateConnection("") #All studies es <- all$getGEMatrix(c("TIV_2007", "TIV_2008", "LAIV_2008"), summary = TRUE) head(pData(es)) ``` With a single command, we can download the three relevant normalized and transformed expression matrices, summarize them by gene and combine into a unique ExpressionSet with relevant phenoData. It is also a lot faster than GEO as each matrix is available as a single file. ## How about the other datasets? Unlike expresssion matrices, the other datasets are stored as tables in the database. ![](/home/rsautera/Pictures/ImmuneSpace/sdy269hai.png)
SDY269 HAI DATASET在免疫空间上可见

###下载它们可以使用“getDataset”功能访问。```{R listds}库(data.table)sdy269 $ listdatasets()hai < - sdy269 $ getdataset(“hai”)hai``为性能,函数返回`data.table`对象。当查询所有研究时,它特别有趣。````{r getdataset_cross} ahai <--all $ getdataset(“hai”)```###数据集过滤,因为`getdataset`是围绕`rlabkey`的'labkey.selectrows`功能的包装器,我们使用`makefilter`创建可以由Labkey解释的过滤器。````{r makefilter}库(rlabkey)病毒_filter < - makefilter(c(“病毒”,“包含”,“h1n1”))hai_f < - sdy269 $ getdataset(“hai”,colfilter =病毒_filter)病毒_filter2 < - makefilter(c(“病毒”,“平等”,“A / Brisbane / 59/2007(H1N1)”))Hai_F < - SDY269 $ GetDataset(“海”,Colfilter = Virus_Filter2)#moltiple滤波器可以指定分析物_filter < - makefilter(c(“分析物”,“平等”,“IFG”),C(“学习时间收集”,“IN”,“0; 7”))ELISA < - SDY269 $ GETDATASET(“ELISA”,COLFILTER = Analyste_Filter)```##交叉测定分析使用相同的信息数据集,我们可以合并来自各种测定类型的结果。在这里,我们使用ELISPOT和流式细胞术结果来再现Nakaya等人的图1D。````{R交叉分析}#ELISPOT分析物_Filter2 < - makeFilter(C(“分析物”,“相等”,“IgG”),C(“学习时间收集”,“相等”,“7”))ELISPOT <- SDY269 $ getDataset(“ELISPOT”,COLFILTER = ANALYSTE_FILTER2,RELOAD = TRUE)ELISPOT < - ELISPOT [,ELISPOT_RESPONSE:= SPON_NUMBOT_REPORTED + 1] ELISPOT < - ELISPOT [,LIST(Contentant_ID,ELISPOT_RESPONSE)]#FLUP FCS < - SDY269 $getDataset(“fcs_analyzed_result”)fcs < - fcs [,fcs_response:=(as.double_cell_number)+ 1)/ as.double(base_carent_population)] [scuarch_time_colected == 7] res < - merge(ELISPOT,FCS,by =“参与者_ID”)库(GGPLOT2)GGPLOT(RES,AES(x = AS.DOUBLE(FCS_RESPONSE),Y = ELISPOT_RESPONSE,COLOR = COHORT))+ GEOM_POINT()+ SCALE_Y_LOG10()+ SCALE_X_LOG10()+ GEOM_SMOOTH(方法=“LM“)+ XLAB(”总质上的Plasmablast(%)“)+ Ylab(”流感特定细胞\ n(每10 ^ 6 PBMC)“)+ Theme_IS()```只需要几条线来计算折叠变化 and a sinle `merge` operation is enough to combine data accross assays and bind metadata.
# 还有什么?##探索大多数数据集的探索,`Quick_plot`是一种利用标准化数据集以相关方式绘制数据的函数。它具有有限数量的选项,应使用首先查看数据。可以通过下载R会话中的数据,如上面的用例所示,可以实现更高级的图。````{r quick-plot} sdy269 $ quick_plot(“hai”,normalize = false)sdy269 $ quick_plot(“hai”,filter = Virus_filter2,Normalize = False,Color =“年龄”,Shape =“性别”)```这是与交互式[Data Explorer模块]使用的相同功能(https://www.immunespace.org/dataExplorer/studies/begin.view)。````{R QP_CROSS} Virus_Filter3 < - makefilter(C(“「群组”,“包含”,“TIV”),C(“学习_time_coollat​​ed”,“In”,“0; 21; 28; 30; 180”))All $ Quick_plot(“HAI”,Filter = Virus_Filter3,Normalize = True,Color =“Age”)```##在线R / RMD报告免疫空间上可用的报告使用免疫申请人编写。代码可用,并将通过Labkey在Web Portal和本地报告的报告工作。![](/ home / rsautera / workspace / git / bioc2016 / inst / img / sdy180report_cropped.png)
SDY180中提供的实时报告示例

##技术详细信息*用于性能和缓存的参考类*数据库的连接是用`rcurl` *`data.table`进行处理,用于处理下载的数据集##未来*返回实例化以允许连接到研究子集。*使用[数据查找器](https://www.immunespace.org/project/studies/begin.view)r. *将Rstudio集成到免疫空间(Spawn预过滤的R会话)。*接受用户在免疫空间上进行了R / RMD报告。*改善免疫禁度和免疫空间的测试。