2016年6月25-26日(开发者日:6月24日)
斯坦福大学,斯坦福,加州
这次会议突出了当前国内外的发展Bioconductor.上午的科学讲座和下午的研讨会为与会者提供了分析和理解高通量基因组数据所需的见解和工具。“开发人员日”在6月24日的主要会议之前举行,为开发人员和准开发人员提供了一个深入了解项目方向和软件开发最佳实践的机会。2021欧洲杯体育投注开户会议就在前面用户!2016.
9:00 - 10:00介绍;项目及其他更新
10:00 - 11:15闪电谈话
11:15 - 11:30休息
11:30 - 12:30闪电谈话2
中午12:30 - 1:30
1:45 - 2:00促进讨论:交互式可视化
2:00 - 2:45闪电车间
2:45 - 3:15休息
3:15 - 4:00闪电工作坊2
4:00 - 5:00开发者日主题演讲。罗伯特先生,23andMe。用于基因组分析的分布式内容生成和创建管道。
8:00 - 8:30。登记和欧式早餐
演讲者
社区的人
中午12点至1点午餐
1:00 - 2:50。下午的研讨会,第一部分。
逐渐了解R而且Bioconductor.Valerie Obenchain, Lori Shepherd(罗斯威尔公园癌症研究所)。初学者。[幻灯片] [github]
介绍ImmuneSpaceR.Renan Sauteraud, Lev Dashevskiy, Greg Finak, Raphael Gottardo (Fred Hutchinson癌症研究中心)。中间。[幻灯片] [github]
用R和分析单细胞RNA-seq数据Bioconductor.Davide Risso, Kelly Street, Michael Cole(加州大学伯克利分校)。中间。[幻灯片] [github]
2:50 - 3:10休息
3:10 - 5:00。下午的研讨会,第二部分。
接待/社交时间5:00 - 7:00
8:00 - 8:30。登记和欧式早餐
演讲者
社区的人
中午12点至1点午餐
1:00 - 2:50。下午研讨会,第三节
RNA-seq的低水平探索性数据分析和方法开发。Michael Love(哈佛陈曾熙公共卫生学院)。中间。[幻灯片] [github]
使用VisRseq平台使非程序员合作者可以访问您的包。Hamid Younesy(西蒙弗雷泽大学),Torsten Möller(维也纳大学)Mohammad M. Karimi(英属哥伦比亚大学)。初学者。[幻灯片] [github] [软件]
的MultiAssayExperiment多组学实验分析类。Levi Waldron, Marcel Ramos(主持人)(纽约市立大学公共卫生学院),Vince Carey(布莱根妇女学院),Kasper Hansen(约翰霍普金斯大学),Martin Morgan(罗斯威尔公园癌症研究所)。中间。[幻灯片] [github]
分析RNA-seq数据中的剪接事件SGSeq.Leonard Goldstein(基因泰克公司)。中间。[幻灯片] [github]
你好范围:介绍分析基因组范围R.Michael Lawrence (Genentech公司)。中间。[幻灯片] [github]
2:50 - 3:10休息
3:10 - 5:00。下午研讨会,第4课
包装你的R在云端分析全国范围癌症基因组的工具。尹腾飞,Rohit Reja, Jing Zhao, Marko Zecevic, Noel Namai, Kristina Clemens (Seven Bridges Genomics)。初学者。[幻灯片] [github]
分析DNA甲基化数据Bioconductor.Peter Hickey, Kasper Hansen(约翰霍普金斯大学彭博公共卫生学院生物统计系)。中间。[幻灯片] [github]
贝叶斯推理使用介绍斯坦癌症基因组学的应用。杰奎琳·布洛斯(西奈山伊坎医学院),本杰明·古德里奇(哥伦比亚大学),埃里克·诺维克(斯坦集团公司)。中间。[幻灯片] [github]
R/Bioconductor基于质谱的蛋白质组学工具。Laurent Gatto(剑桥大学)。中间。[幻灯片] [github]
接待/社交时间5:00 - 7:00
逐渐了解R而且Bioconductor.Valerie Obenchain, Lori Shepherd(罗斯威尔公园癌症研究所)。初学者。
本工作坊介绍R而且Bioconductor,是面向新手的Bioconductor用户。参与者可以期望学习的要领R,包括了解基本数据结构和导航帮助系统。参加者也将被介绍到广泛的包可用Bioconductor,如何找到与他们的特定需求相关的软件包,以及如何从特定资源(小插图,工作流程,在线支持论坛)中受益Bioconductor社区。
构建并运行自动化的NGS分析工作流程。Thomas Girke(加州大学河滨分校)。中间。
拟建的工作坊将介绍systemPipeR作为为大多数NGS应用程序构建和运行复杂分析工作流的环境。这包括对命令行和R/Bioconductor软件的支持,以及在计算机集群上进行并行评估的资源,以及以PDF和HTML格式自动生成分析报告。该活动将涵盖所谓的工作流设计模块的基本用法、自定义工作流的构建、外部命令行软件的集成以及使用单个命令从头到尾运行NGS工作流的自动化例程。最后一部分将演示如何运行一个相对复杂的示例工作流(如。Ribo-Seq和/或smallRNA-Seq)在大量的输入样本(这里是FASTQ文件)上,在单机和带有调度器的计算机集群上。
介绍ImmuneSpaceR.Renan Sauteraud, Lev Dashevskiy, Greg Finak, Raphael Gottardo (Fred Hutchinson癌症研究中心)。中间。
ImmuneSpace是人类免疫学项目联盟(HIPC)的数据门户。HIPC计划由NIH资助,是一个多中心合作的努力,以描述不同刺激和疾病状态下不同人群的免疫系统状态。这项持续的工作已经产生了大量不同的高通量、高维生物数据(流式细胞术、CyTOF、RNA-Seq、Luminex等)。迄今为止,HIPC生成的所有数据以及其他NIAID资助项目生成的其他选定数据集已通过免疫空间公开提供,并准备使用免疫空间内置的可视化和分析工具进行研究。ImmuneSpaceR是最近发布的一个ead包,旨在提供一个快速和易于使用的界面来下载,操作和分析数据。在本次研讨会中,我们将介绍ImmuneSpaceR包,从实例化连接到ImmuneSpaceR,到标准化交叉研究数据的可视化。在本次研讨会结束时,用户将能够使用门户网站获取感兴趣的数据,将免疫空间的数据与其他资源结合起来,并撰写报告,提交给免疫空间团队以添加到网站中。学员应具备R和BioConductor常用数据结构的基本知识。我们鼓励有兴趣的参与者先在www.immunespace.org上尝试该门户网站
单细胞RNA-seq数据分析R而且Bioconductor.Davide Risso, Kelly Street, Michael Cole(加州大学伯克利分校)。中间。
在本研讨会中,我们将展示如何使用R和Bioconductor对单细胞RNA-seq数据进行统计分析。从基因水平的读取计数开始,我们将强调典型工作流程的三个重要方面:(i)质量控制(QC)和标准化;(ii)聚类分析和细胞亚群的发现;(iii)谱系分析和伪时间细胞排序。参与者将学习如何计算QC的常用指标,可用于基因和样本过滤和归一化;如何使用充分利用summarizeexperiment容器的新包clusterExperiment(可在Github上http://github.com/epurdom/clusterExperiment获得,即将提交给Bioconductor)发现新的细胞群;以及如何在伪时间中排列细胞。参与者需要对RNA-seq、标准化和聚类的概念以及R和Bioconductor软件有一定的熟悉。
编写高效、可伸缩的代码。Martin Morgan(罗斯威尔公园癌症研究所)。中间。
这个研讨会加强了导致高效和可扩展的常见模式R而且Bioconductor代码。第一部分我们讨论了向量化,测量基本性能,并确保我们的结果是一致和正确的。第二部分探讨了并行计算的方法BiocParallel包,包括在并行计算期间从错误中恢复和调试错误的策略。
注释使用的高吞吐量数据Bioconductor资源。詹姆斯麦克唐纳(华盛顿大学)中级。
在分析高吞吐量数据时,每个被测量的东西通常都有一个单独的(通常是神秘的)标识符。当您希望向合作者展示您的结果时,您通常希望将该ID映射到更熟悉的东西,例如HUGO基因符号、Entrez基因ID或类似的东西。您可能还需要将id映射到KeGG或Gene Ontology id以进行其他分析。Bioconductor项目有各种注释包,旨在简化这一过程。在本研讨会中,我们将学习如何使用实际示例使用这些注释包。
交互式可视化epiviz.Héctor Corrada Bravo, Jayaram Kancherla, Justin Wagner, Deok Park(马里兰大学,College Park)。中间。
本研讨会概述了通过epivizr提供的交互式可视化工具。它将围绕使用Bioconductor工具和注释包分析表观遗传数据。完成课程后,参与者将能够通过R设置交互式可视化会话,从不同的R / Bioconductor对象(包括注释基础设施提供的对象)加载数据,使用epiviz用户界面提供的模式与数据交互,并编写可以重现交互式可视化分析的脚本。建议您熟悉Bioconductor基础架构。
单细胞差异表达及基因扩增。Andrew McDavid, Raphael Gottardo, Greg Finak (Fred Hutchinson癌症研究)。中间。
我们将学习如何使用这个包桅杆分析单细胞基因表达实验。从转录本计数矩阵(细胞转录本)开始,我们将讨论质量控制、过滤和探索性数据分析的初步步骤。一旦我们对高质量的表达式感到满意,我们将考虑差分表达式的测试和可视化结果的方法。从基因级合成到模块级的语句通常是有帮助的。因此,我们将学习如何使用MAST来检测基因集富集。将提供一个已被细胞因子刺激的粘膜相关不变T细胞(MAITs)的示例数据集。同时也鼓励参与者自带数据。本课程的先决条件将包括基本R语法,绘图和使用数据的操作data.table
而且ggplot2
.线性模型的背景也可能有用。
管理大型生物序列数据Biostrings而且解读.埃里克·赖特(威斯康星大学,麦迪逊分校)。中间。
本研讨会将介绍如何使用Biostrings而且解读软件包来管理大的生物序列数据。参与者将学习如何建立序列数据库,管理数据库,提取序列,操作序列,运行大规模的分析片段,并使用这两者执行其他任务R包。
RNA-seq的低水平探索性数据分析和方法开发。Michael Love(哈佛陈曾熙公共卫生学院)。中间。
对探索Bioconductor RNA-seq比对感兴趣?对Bioconductor开发RNA-seq方法感兴趣?在本研讨会中,我们将介绍对RNA-seq数据工作有用的基本类:配对比对,外显子,转录本和基因等。我们还将介绍对操纵RNA-seq数据有用的基本功能:查找比对和转录本之间的兼容重叠,基因组和转录组坐标之间的映射,计算覆盖范围,可视化基因结构等。作为一个激励性的例子,我们将研究在RNA-seq数据中可以观察到的各种偏差:随机六聚体启动偏差、位置偏差和GC内容偏差。所谓“低水平”,我的意思是这个研讨会将不涵盖分析汇总RNA-seq数据的基本工作流程和统计包,例如计数矩阵。
使用VisRseq平台使非程序员合作者可以访问您的包。Hamid Younesy(西蒙弗雷泽大学),Torsten Möller(维也纳大学)Mohammad M. Karimi(英属哥伦比亚大学)。初学者。
本次研讨会的目标是介绍VisRseq平台并带领参与者快速完成创建模块的过程R-apps从他们的R包。我希望这对生物信息学家和开发基于r的分析工具的软件包开发人员非常有用,他们希望让非程序员合作者或公众能够访问这些工具,而不必花费时间创建2021欧洲杯体育投注开户大量的图形用户界面。我将引导参与者通过创建不同类型的应用程序的几个例子,从简单的绘图(例如ggplot)到中间(例如集群)到更高级的(例如edgeR和DEseq)包。我还将展示如何将几个r -app链接在一起,以创建更复杂的工作流。参与者需要有R的初级或中级知识,并有一台安装了R和Java的机器。
的MultiAssayExperiment多组学实验分析类。Levi Waldron, Marcel Ramos(主持人)(纽约市立大学公共卫生学院),Vince Carey(布莱根妇女学院),Kasper Hansen(约翰霍普金斯大学),Martin Morgan(罗斯威尔公园癌症研究所)。中间。
本研讨会将介绍MultiAssayExperiment数据类,用于多分析或多组学实验的分析。这个类提供了一个单一的数据对象来存储和链接基于id的数据集(如matrix和ExpressionSet)和基于范围的数据集(如rangedsummarizeexperiment和GRangesList),它们之间以及与总体实验级元数据之间。这些数据对象易于创建,并允许在基因组特征、样本和分析之间进行协调的子集设置,使用标准括号符号,并为不同的基本数据类提供一致的接口。子集可以使用基因/探针标识符或基因组范围形成。这个研讨会将对初学者Bioconductor用户开放,尽管一些熟悉基因组范围将是有帮助的。研讨会将介绍如何创建和操作各种组学数据的MultiAssayExperiment,以及如何合并新的数据类。
分析RNA-seq数据中的剪接事件SGSeq.Leonard Goldstein(基因泰克公司)。中间。
SGSeq是一个R / Bioconductor包用于分析短读RNA-seq数据中的注释或以前未描述的剪接事件。输入数据是以BAM格式映射到参考基因组的序列读取。基因模型以全基因组剪接图的形式表示,剪接图可以从转录本注释中获得,也可以从数据中预测。拼接事件从图中识别出来,并使用跨越事件边界的结构兼容读取在本地进行量化。工作坊介绍SGSeq数据结构和说明典型的分析工作流程,包括剪接事件预测,量化,可视化和解释。
你好范围:介绍分析基因组范围R.Michael Lawrence (Genentech公司)。中间。
基因组范围是高通量基因组数据分析的核心,Bioconductor提供了一个集成的平台,用于计算和注释数据,如读取比对、变异调用、转录模型、覆盖向量、基因组分析等。在Bioconductor之外,高级应用程序,如床工具和床罩,为基因组区间的简单、常见操作提供了方便的接口。Bioconductor Ranges API相对更灵活,也更复杂。尽管简单的操作通常有简单的解决方案,但这些解决方案隐藏在复杂性之中。一个新的包HelloRanges试图通过将床工具调用编译到R/Bioconductor代码来解决这个问题。编译器输出的代码旨在正确、合理高效,而且重要的是具有教学意义。代码促进了最佳实践,并在API中明确了一些可能令人惊讶的假设。本教程将从床具的角度介绍基因组数据处理的常见工作流程,而学生则使用HelloRanges来学习Bioconductor等等物。假定对BED、BAM和VCF文件中的数据有基本的熟悉。
包装你的R在云端分析全国范围癌症基因组的工具。尹腾飞,Rohit Reja, Jing Zhao, Marko Zecevic, Noel Namai, Kristina Clemens (Seven Bridges Genomics)。初学者。
癌症基因组云(CGC)由七座桥梁(Seven Bridges)建立,由美国国家癌症研究所(National Cancer Institute)资助,承载着癌症基因组图谱(TCGA),这是世界上最大的癌症基因组数据集之一。提供计算资源和优化的便携式生物信息学工具,以立即、协作和可重复地分析任何规模的癌症数据。Seven Bridges平台不仅可以在AWS上使用,还可以在谷歌云上使用。随着Docker和通用工作流语言(Common Workflow Language)的开放标准,将任何编程语言的工具打包到云中并对pb级的数据进行计算从未如此容易。开源R/Bioconductor软件包sevenbridges为包括CGC在内的七桥平台提供完整的API支持,支持对项目、任务、文件、账单、应用程序等的灵活操作,用户可以轻松地在R中开发全自动工作流,在云中进行从原始数据到报告的端到端数据分析。最重要的是,sevenbridgespackage还提供了接口来描述R中的工具,并使其可移植到JSON和YAML中的CWL格式,您可以轻松地与合作者共享,在本地或云中的不同环境中执行,一切都是完全可复制的。结合R API客户端功能,用户将能够在R中创建一个CWL工具,并在癌症基因组云中执行,以大规模分析大量的癌症数据。
在本课程中,您将学习为您的R cwl工具和docker容器创建命令行接口的最佳实践,将bioconductor工作流放在cwl中并在云中执行,使用API客户端为您的帐户执行不同的操作,并使用R接口描述cwl工具/工作流。
分析DNA甲基化数据Bioconductor.Peter Hickey, Kasper Hansen(约翰霍普金斯大学彭博公共卫生学院生物统计系)。中间。
DNA甲基化是DNA的表观遗传修饰,参与基因表达的调节。用于研究DNA甲基化的流行分析方法是Illumina 450k和EPIC微阵列、还原亚硫酸氢盐测序和全基因组亚硫酸氢盐测序,每种方法都有自己的一套生物信息学挑战。然而,也有一些共同的统计主题,例如DNA甲基化沿基因组的强空间相关性,以及这些测定的测量结果是来自异质细胞群的聚集物。Bioconductor项目目前包括50个软件包分析DNA甲基化数据.本次研讨会将介绍其中的一些软件包,并帮助用户为自己的分析确定合适的工具和方法。研讨会的演讲者是几个流行的Bioconductor软件包2021欧洲杯体育投注开户的开发人员和贡献者,包括minfi用于分析Illumina甲基化微阵列和bsseq用于分析全基因组亚硫酸氢盐测序数据。
贝叶斯推理使用介绍斯坦癌症基因组学的应用。杰奎琳·布洛斯(西奈山伊坎医学院),本杰明·古德里奇(哥伦比亚大学),埃里克·诺维克(斯坦集团公司)。中间。
本研讨会将提供贝叶斯分析的背景和介绍,使用Stan和R接口Stan。然后,我们将通过癌症基因组学领域的1-2个应用示例进行工作。斯坦是一种现代概率编程语言,实现了MCMC抽样的全贝叶斯统计推理(NUTS, HMC)、变分推理的近似贝叶斯推理(ADVI)和优化的惩罚最大似然估计(L-BFGS)。潜在应用包括:*突变特征检测模型(癌症基因组学)*克隆反褶积模型(癌症基因组学)*评估(预测)生物标志物对治疗的反应(癌症基因组学)* RNA表达数据分析(基因组学)*基因集富集分析(基因组学)用户应熟悉基本的概率论和统计方法。必须有R方面的经验。基因组数据和癌症生物学的知识会有所帮助,但不是必需的。在这个研讨会之后,用户将有一个基本的熟悉斯坦和RStan.他们将能够在Stan中编写简单的模型,并熟悉在Stan中指定和拟合复杂模型的过程。
R/Bioconductor基于质谱的蛋白质组学工具。Laurent Gatto(剑桥大学)。中间。
在本次研讨会上,我们将使用R/Bioconductor包来探索、处理、可视化和理解基于质谱的蛋白质组学数据,从原始数据开始,再到鉴定和定量数据,讨论它们与测序数据相比的一些特点。参与者将获得用于质谱和蛋白质组学的Bioconductor包的总体概述,并学习如何浏览原始数据和重建定量数据。该研讨会面向初学者到中级水平,例如,想要开始使用质谱和蛋白质组学的资深R用户,或想要熟悉R和Bioconductor基础设施的蛋白质组学从业者。