由主持人索纳利·阿罗拉提供的《生物生物学2017》讨论笔记
BioC2017_TCGA_GTEx_BOF
这个资源库包含了一个“Birds-of-Feather”(BOF)会议的简要大纲,该会议将讨论分析来自TCGA和GTEx的公开的癌症数据
, TCGA数据
39个项目
29个主要网站
14551例
274724个文件
22144个基因
3115606个突变
GTEx数据
53个组织
544年捐助者
8555个样本
获取TCGA数据的来源
很好的交互式方式选择示例,创建一个清单文件,然后使用gdc数据传输工具下载。
+数据可用作为生物导体rangedsummarizedexperexperiment对象。
+数据从选择的出版物也可用
+基因水平和外显子水平的数据。
包含来自其他来源的数据,如ICGC, TARGET, GTEx, TOIL
RNASeq数据呈现为log2(RPKM+1),没有原始的读取计数用于edgeR或DESeq2的输入
突变数据,拷贝数数据,蛋白表达rpa, DNA甲基化,miRNA亚型表达数据。
ExperimentHub()包含TCGA中原始的RNASeq基因计数。GSE62944
“‘{r eval = FALSE}
库(ExperimentHub)
嗯= ExperimentHub ()
查询(呃,“TCGA”)
tumor_samples =呃[[" EH164 "]]
normal_sample =呃[[" EH165 "]]
' ' '
- 可以找到使用kallisto重新规范化TCGA中的RNASeq数据在这里
获取GTEx数据的来源
GTEx网站
快到了! !将被添加到ExperimentHub()
你通常对TCGA/GTEx数据做什么样的分析?正在使用的软件包?
聚类样本/基因- PCA图。
两组之间的差异表达分析?0使用RNASeq数据
突变分析
其他公共可用的数据库癌症/酷资源研究癌症
确认
马丁·摩根和核心生物导体团队
GTEx项目——基因型-组织表达(GTEx)项目由美国国家卫生研究院主任办公室共同基金、NCI、NHGRI、NHLBI、NIDA、NIMH和nnds支持。本手稿中描述的分析所用的数据来自:[在适当的地方插入]MM/DD/YY和/或dbGaP登录号phs000424.vN的GTEx Portal。在MM / DD / YYYY pN。
本文讨论的TCGA数据由TCGA研究网络生成:http://cancergenome.nih.gov/。