指南:BoF Bioc2017:使用Bioconductor分析GTEx和TCGA公开可用的癌症基因组学数据
0
2
进入编辑模式
shepherl 2.7 k
@lshep
最后一次见到是1小时前
美国

由主持人索纳利·阿罗拉提供的《生物生物学2017》讨论笔记

BioC2017_TCGA_GTEx_BOF

这个资源库包含了一个“Birds-of-Feather”(BOF)会议的简要大纲,该会议将讨论分析来自TCGA和GTEx的公开的癌症数据

, TCGA数据

  1. 39个项目

  2. 29个主要网站

  3. 14551例

  4. 274724个文件

  5. 22144个基因

  6. 3115606个突变

GTEx数据

  1. 53个组织

  2. 544年捐助者

  3. 8555个样本

获取TCGA数据的来源

  1. NCI基因组数据共享(GDC)网站

  2. 很好的交互式方式选择示例,创建一个清单文件,然后使用gdc数据传输工具下载。

  3. NCI癌症基因组云(CGC)试点

  4. 远大研究所- FireCloud

  5. 系统生物学研究所

  6. 七桥基因组公司CGC

  7. NCI CGC工作室/教程由团队CGC

  8. NCI CGC简介PPT

  9. TCGAbiolinks

  10. Recount2

+数据可用作为生物导体rangedsummarizedexperexperiment对象。

+数据从选择的出版物也可用

+基因水平和外显子水平的数据。

  1. RTCGAToolbox

  2. UCSC齐娜服务器

  3. 包含来自其他来源的数据,如ICGC, TARGET, GTEx, TOIL

  4. RNASeq数据呈现为log2(RPKM+1),没有原始的读取计数用于edgeR或DESeq2的输入

  5. 突变数据,拷贝数数据,蛋白表达rpa, DNA甲基化,miRNA亚型表达数据。

  6. ExperimentHub()包含TCGA中原始的RNASeq基因计数。GSE62944

“‘{r eval = FALSE}

库(ExperimentHub)

嗯= ExperimentHub ()

查询(呃,“TCGA”)

tumor_samples =呃[[" EH164 "]]

normal_sample =呃[[" EH165 "]]

' ' '

  1. 可以找到使用kallisto重新规范化TCGA中的RNASeq数据在这里

获取GTEx数据的来源

  1. GTEx网站

  2. Recount2

  3. 快到了! !将被添加到ExperimentHub()

你通常对TCGA/GTEx数据做什么样的分析?正在使用的软件包?

  1. 聚类样本/基因- PCA图。

  2. 两组之间的差异表达分析?0使用RNASeq数据

  3. 突变分析

其他公共可用的数据库癌症/酷资源研究癌症

确认

  1. 马丁·摩根和核心生物导体团队

  2. GTEx项目——基因型-组织表达(GTEx)项目由美国国家卫生研究院主任办公室共同基金、NCI、NHGRI、NHLBI、NIDA、NIMH和nnds支持。本手稿中描述的分析所用的数据来自:[在适当的地方插入]MM/DD/YY和/或dbGaP登录号phs000424.vN的GTEx Portal。在MM / DD / YYYY pN。

  3. 本文讨论的TCGA数据由TCGA研究网络生成:http://cancergenome.nih.gov/

公共数据, TCGAGTEx教程•2.0 k的观点
添加评论

登录然后再加上你的答案。

流量:过去一小时内访问了629个用户

使用本网站即表示接受我们的用户协议和隐私政策

由的2.3.6版本