生物体通讯

张贴了瓦莱丽遵守,2014年10月

内容

软件基础设施

GRCh38组装

GRCH38人类基因组组件可用生物体作为bsgenome.TranscriptDbSNPloc包裹。

GRCH38组件包括主组件(非冗余单倍体组件)和替代序列(ALT LOCI)。为基因组的区域提供ALT基因座,其中变化防止单个序列表示。这些地区并不新鲜,但随着变体检测的工具已经变得更加突出。

以前的GRCH37汇编包括补丁发布标记为“修复”或“小说”。“修复”贴片被纳入GRCH38的主要组装中,而“新颖”贴片被移入ALT基因座单元。GRCH38的“多序列”​​性质提出了关于如何在对准和下游分析方面最佳地使用这些替代序列的问题。

HTSLIB.

samtools库和相关子工具在HTS数据分析中起着不可或缺的作用。htslib是libbam的继承者,libbam目前是由samtools提供的。具体来说,htslib是一个用于处理高通量测序数据的C库,提供了用于操作SAM、BAM和CRAM序列文件(类似于旧的Samtools API,但比旧的更灵活)和用于操作VCF或BCF变体文件的API。

htslib的实施是在作品中生物体并且可能会被实施为独立包。遵循马丁的发展GitHub网站

S4Vectors.绞喉拆分完成

9月Hervé完成了非范围基于代码的移动绞喉S4Vectors.。虚拟向量列表班级也在移动dataframe.rle.击球。2021欧洲杯体育投注开户现在使用开发人员使用或构建这些课程S4Vectors.

生物体支持网站

9月份生物体邮件列表被换成了生物磁盘,并重命名Bioconductor支持网站。这只影响生物导体列表;Bioc-devel保持不变(bioc-devel@r-project.org)。

此举是由列表流量的体积激励,突出了对帖子的高级搜索,标记和实时编辑的需求。理想情况下,新界面将鼓励从首次用户参与并简化主题管理。

Marc进口了最后11年的帖子,以在新环境中创造连续性。一种常问问题可以帮助帮助站点导航和常见任务,如发布,合并或跟踪主题。

感谢Marc和Dan的工作。

开发人员的角落

样式标记文件生物焦

生物焦套餐提供了一种快速简便的方法来造型的标记文件生物体时尚。它包括用于创建Vignettes,Workflows或其他项目文档的PDF和HTML文档的所有标准格式样式。这HTML.软件包Vignette的版本是造型和颜色主题的演示。

包装提供格式优势,超过标准的标准,如数字,改进的表显示和乳胶兼容的数学符号。在“生物科技”::: Markdown`中包裹,可以包括自定义样式表:

Biocstyle :: Markdown(CSS.FILES = C('my.css'))

重用和回收:电力进口

生物体基础架构包含丰富的HTS分析工具。由于这些方法和容器存在于许多包中,因此在添加新功能时,新用户可能难以发现和开发人员难以记住。2021欧洲杯体育投注开户

进口Generic in rtracklayer就是这样一个工具。进口读取和解析大型文件格式,如床,BAM,BIGWIG,GFF,FASTA和链文件。该方法在*文件对象上运行(例如,Bamfile.)和参数(例如,Scanbamparam.对象,它允许灵活地控制数据的解析和子集。返回的数据进口被解析为有用的下游容器,例如隆重rle.

进口应作为与大文件交互时选择的选择工具,例如可用的文件AnnotationHub,或开发新的读/解析功能时。

biocmultiassay.

在2014年BIOC的开发日期间,Levi Waldron对他的BioCMultiSsay项目的讨论为社区产生了很多兴趣。这项努力,由Levi,Vince,Kasper和Martin,旨在创造生物体高效操纵与分析多捕捞OMICS实验的工具。

主要动机是将数据组合在多个实验中,用于常见的样本或患者。目标是开发用于提取由诸如基因组位置或基因ID等索引定义的数据子集的类和方法,以及简化跨越多种基因组数据类型的分析。数据是高尺寸测定,例如基因和蛋白质表达,拷贝数,甲基化,体细胞突变或微稻草。

这个项目有两个GitHub.网站与代码原型和a谷歌集团对于会议电话通知和跟踪进度。

采访Janet Young,FHCRC博士

通讯的这一部分突出了个人或团体的工作生物体社区。本月我们与janet年轻的janet年轻来自弗雷德·哈金森癌症研究中心。珍妮特最初是来自英国,剑桥大学的自然科学院,以及伦敦大学学院的遗传学博士学位。她目前是基本科学部门Malik实验室的一名员工科学家。

问:开始前,能介绍一下你自己吗?

我在2000年加入弗雷德·哈卡特,并将串独的实验室担任后代作为一个职员科学家。我自己的研究专注于哺乳动物嗅觉受体基因家族的演变和转录调控,但我也帮助他人有项目来测量前列腺癌中的基因组拷贝数,并测量健康人体组织中的甲基化水平。当倒钩(桁架)退休时,我在Tapscott实验室中度过了时间,我们研究了如何涉及转换元素的肌肉营养不良的形式。目前,我为Malik实验室的各种项目提供了生物信息学支持。本集团研究进化生物学和遗传冲突,主要是在果蝇,灵长类动物和酵母中。

问:你是如何开始的生物体

我开始工作了生物体在帮助串行和TAPSCOTT实验室的其他微阵列项目时。最初我用过R./生物体仅用于创建微阵列数据的诊断句,但很快就开始使用Limma和Lumi进行分析步骤。

问:怎么样生物体适合您当前的工作流程?

我在很大程度上使用它来分析这些天的深度测序数据。我们使用各种上游软件,如Tophat,BWA和Gatk。我用生物体对于像差异表达分析等的东西,比较覆盖范围寻找基因组拷贝数的变化,过滤SNP或检索和分析基因/注释。通常我使用rtracklayer导出数据以在IGV或UCSC基因组浏览器中查看。以及成为一个伟大的分析工具本身,生物体充当胶水,帮助我整合来自其他工具的结果。

问:有没有生物体您发现特别有用的资源?

在哈科特提供的本地课程非常有帮助。我也喜欢邮件列表上的响应Q和A.所有软件都有错误;知道错误以及时解决错误使您继续使用它。包裹鸽子欧洲杯2021体育彩票是一个有价值的“独立”资源,可以帮助您立即使用特定的包裹或任务。

感谢您与我们交谈并分享您的见解。

季度项目统计数据

生物体项目继续在全球范围内扩展。下个季度会有课程产品在日本,德国英国和美国。2014年8月,拉丁美洲生物导体实验室基金会在巴西里德岛普雷托举行其官方就职典礼。实验室是一个非营利性科学倡议,以代表和扩展生物体到拉丁美洲的研究界,并由奔驰的Carvalho和Houtan Noushmehr领先。

网站流量

Google Analytics将以下新访客报告于2014年7月1日至9月28日的网站:

新的vs返回用户
会话
回到访客 179,242(63.81%)
新访客 101,668(36.19%)

全国总体网站流量:

网站访问位置
会话
美洲 118,398(42.15%)
欧洲 93,973(33.45%)
亚洲 57,744.(20.56%)
大洋洲 8015年(2.85%)
非洲 2,403(0.86%)
其他 377.(0.13%)

包下载

不同的IP下载的数量生物体7月,8月和9月的软件包分别为36900,36749和36618,平均为36756.可提供全面的包装下载统计摘要这里

资源,课程和会议

搜索生物体主题的材料

过去课程和会议的材料长期以来一直播放生物体通过会议名称和日期分类的网站。2014年BIOC 2014今年我们通过主题区域或关键词,有几个要求更加精致地搜索这些材料。

在回应中,Sonali和Dan对所有2014年材料进行了分类并实施了一个新的关键词搜索表界面。该计划是指索引所有未来的材料,而2014年之前将以旧格式提供(请参阅“搜索”表格下方的课程)。

出版物

如果您正在寻找资源,以增强您与基因组范围和序列合作的知识生物体以下出版物可能是兴趣:

用于计算和注释基因组的软件
此稿件描述了可用的数据结构生物体用于在基因组上代表和注释范围的基础设施。重点是绞喉Genomicranges.几个地貌为转录结构提供支持,读取对准和覆盖向量的包装。

具有R和Biocumon的可扩展基因组学描述和实施了分析大型基因组数据的策略R.生物体。主题包括可扩展的处理,摘要和可视化。

Biocumon 3.0释放

发布生物体3.0计划于10月14日。此版本将继续使用当前版本R.(3.1.1)。访问网站寻求帮助更新软件包看看发布时间表

接下来的活动

高通量测序数据分析的实用课程ebi,英国湖克森
2014年10月20日至25日

学习R / Biocumon序列分析FHCRC,西雅图WA,美国2014年10月27日至29日

生物欧洲2015年Embl,Heidelberg,德国2015年1月12日至15日

请向Valerie发送评论或问题vobencha@fhcrc.org.