前言

一个贴纸

想象一个没有参考基因组的世界。只要我们收到新的RNA-seq数据,我们需要运行它通过一个汇编程序来识别表达序列。我们将需要检查每个序列来确定其可能的功能,例如,基于序列图案。这个过程类似于单细胞的现状数据分析;简单地读取换成细胞,与集群组件,基因与细胞类型。典型的医生希望他们的集群是合理的代理的生物感兴趣的国家和他们的人工注释的集群是准确的。这样的“手工”的过程是难以复制和扩展到更大的数据集涉及不同的细胞类型。

解决方案是执行自动化的细胞类型注释,即细胞类型分类(或偶尔,“标签转让”)。这些方法比较细胞在一个新的数据集和策划参考资料已知的细胞类型,引用类型分配每一个新细胞,其表达谱最相似。这允许用户跳过的平凡的注释数据,直接跳转到有趣的问题——我的细胞类型的变化或表达丰度在治疗吗?有有趣的子结构内部现有的人口吗?在这方面,自动注释方法单细胞字段等于基因组对准器,和我们预料前也将成为单细胞数据分析的标准程序。

这本书涵盖的使用,自动注释的一种实现方法。如果你想要不同的注释方法的调查——这本书不适合你。如果你想创建手工集群定义——这本书不适合你。(读另一个相反)。如果你想使用的pre-Bioconductor版本包,这本书不适合你。但如果你厌倦了手动标注单细胞数据和你想用你的生活做些更有意义的事情,然后继续读下去。