%\VignetteEngine{knitr::knitr} %\VignetteIndexEntry{02 Annotation—Slides} \documentclass[xcolor=dvipsnames]{beamer} \ useppackage {BioconductorSlides} \hypersetup{colorlinks,linkcolor=,urlcolor=Blue} \AtBeginSection[] {\begin{frame} {Outline} \tableofcontents[currentsection] \end{frame}} \begin{document} < >= library(knitr) opts_chunk$set(tidy=FALSE) @ \title{Annotation} \author{Martin Morgan (\href{mailto:mtmorgan@fhcrc.org}{mtmorgan@fhcrc.org}) \\ Fred Hutchinson癌症研究中心\\西雅图,WA} \date{2014年2月3日}\maketitle \begin{frame}{什么是“Annotation”?} \begin{itemize}项目基因——分类方案(例如,Entrez, Ensembl),路径成员,ldots项目基因组——参考基因组;外显子,转录本,编码序列;系统/网络生物学——路径,生化反应,ldots \end{itemize}其他定义(此处未涉及):小说分配函数序列集,\ ldots \{帧}\{帧}开始结束(脆弱){\ Bioconductor}{}注释资源——包模式生物注释包\{逐条列记}\ \项目开始Rpackage {org。*}——基因名称和路径\项目\Rpackage{TxDb。*}——基因模型项目Rpackage{BSgenome。*}——全基因组序列\end{itemize} \end{frame} \section{基因和路径注释}\begin{frame}[脆弱的]{\Rpackage{org. txt . txt。function{keytypes}, \Rfunction{columns}, \Rfunction{keys}, \item检索:\Rfunction{select} \end{itemize} < >= library(org. hs .eg.db) keytypes(org. hs .eg.db) columns(org. hs .eg.db) eggid <- select(org. hs .eg.db, "BRCA1", "ENTREZID", "SYMBOL") @ \end{frame} \begin{frame}{\Rpackage{org. hs .eg.db, "BRCA1", "ENTREZID", "SYMBOL")在\Rclass{vector}或\Rclass{data.frame} \begin{itemize} \item查找和删除重复:函数{复制},函数{唯一}项函数{任何},函数{全部}结束{itemize}之间的Rclass{vector}或Rclass{data.frame}开始{itemize}项匹配函数{%in\%},函数{match}项集合操作:基于共享列连接两个\Rclass{data.frame}。结束\{逐条列记}\{帧}结束\{帧}{\ Rpackage {org开始。SQL (sqlite)数据库\begin{itemize} \item \Rcode{org. chs .eg\_dbconn()}使用\Rpkg{RSQLite}包\item \Rcode{org. chs .eg\_dbfile()}发现位置和查询外部的\R{}。\end{itemize} \end{frame} \section{基因组和基因组坐标}\begin{frame}[脆弱]{\Rpackage{TxDb。支持' select'接口(\Rfunction{keytypes}, \Rfunction{columns}, \Rfunction{keys}, \Rfunction{keys}),\ Rfunction{选择})\项目“简单”构建定制的包当基因模型存在检索基因组范围\ \{逐条列记}结束开始{逐条列记}\ \项目Rfunction{成绩单},\ Rfunction{外显子},\ Rfunction {cd} \ \项目Rfunction {transcriptsBy}, \ Rfunction {exonsBy}, \ Rfunction {cdsBy} - group by基因,transcirpt等等。\{逐条列记}<结束 txdb <- txdb . hsapiens . ucsc .hg19. knowngene . txt <- txdb . hsapiens . ucsc .hg19. txt <- txdb . hsapiens . ucsc .hg19. txtknownGene cdsByTx <- cdsBy(txdb, "tx") @ \end{frame} \begin{frame}[fragile]{\Rpackage{BSgenome。全基因组序列\begin{itemize} \item ' Masks'可用时,例如,重复区域\item加载染色体,基于范围的查询:\Rfunction{getSeq}, \Rfunction{extracttranscriptsfromgenome} \end{itemize} < >= library(bsgenome . hapiens . ucsc .hg19) library(genome features) dna <- extractTranscriptsFromGenome(hapiens, cdsByTx) @ \end{frame} \section{Web resources} \begin{frame}[fragile]{Bioconductor{} Annotation resources - Web}丰富的Web资源\begin{itemize} \item \Biocpkg{biomaRt} (\url{http://biomart.org}),\Biocpkg{rtracklayer} (UCSC基因组浏览器)\item \Biocpkg{ArrayExpress}, \Biocpkg{GEOquery}, Biocpkg{SRAdb} \item \Biocpkg{PSICQUIC}, \Biocpkg{KEGGREST}, \Biocpkg{uniprot。\ldots \item \Biocpkg{AnnotationHub} \end{itemize} \end{frame} \begin{frame}[脆弱]{\Biocpkg{biomaRt}} \begin{itemize} \item \url{http://biomart.org} \item下钻发现:\功能{listMarts}, \功能{listDatasets}, \功能{listFilters}, \功能{liststattributes} \项检索:\功能{getBM} \end{itemize} < > =库(biomaRt)运用< - # #发现&使用useMart(“运用”,数据集=“hsapiens_gene_ensembl”)负责人(listFilters(运用),3)myFilter < -“chromosome_name myvalue < - c(“21”,“22”)myAttributes < - c(“ensembl_gene_id”、“chromosome_name”)res < getBM(属性= myAttributes过滤器= myFilter值=括号,mart=ensembl) @ \end{frame} \begin{frame}[fragile]{\Biocpkg{PSICQUIC}} \begin{itemize} \item \textbf{P}rotemics \textbf{S}标准的\textbf{I}主动的\textbf{C} common \textbf{QU}ery \textbf{I}nterfa\textbf{C}e \item以编程方式访问分子相互作用数据库。\item \url{https://code.google.com/p/psicquic/} \end{itemize} < ## TP53和MYC之间的交互tbl <-交互(PSICQUIC, c("TP53", "MYC")),"9606") nrow(tbl) # 7交互@ %%查看包\href{//www.andersvercelli.com/packages/release/bioc/vignettes/PSICQUIC/inst/doc/PSICQUIC.pdf}{vignette}了解更多细节。\end{frame} \begin{frame}[fragile]{\Biocpkg{AnnotationHub}} \begin{itemize} \item大规模的基因组资源,轻轻整理,便于从\R访问。支持选项卡补全,函数{元数据}发现,选择和过滤。结束\{逐条列记}< < - > =库(AnnotationHub)中心AnnotationHub() # # 10511资源中心结束@ \{帧}{结论}\ \部分开始{帧}}{结论注释资源丰富\开始{逐条列记}\生物模型和自定义项\ Rpackage {org。*} \ Rpackage {TxDb。*} \ Rpackage {BSgenome。*} packages \item基于web访问公共(如\Biocpkg{biomaRt}和\ bioconductor专用(如\Biocpkg{AnnotationHub})资源的\end{itemize} \end{frame} \end{document}