单细胞多组学技术

问题年度:2019 问题类型:工程技术 学科领域:生命科学 学科细分归类:

推荐机构:中国细胞生物学学会

单细胞, 多组学分析

问题背景:细胞是构成生命的基本单位。人体由数十万亿的细胞组成,虽然这些细胞都起源于受精卵,有相同的基因组成,但是构成不同的组织和器官的细胞却有不同的基因表达情况。

在传统的细胞生物学实验中,实验样本通常是大量的细胞,实验操作较为宏观,因此检测到的结果只是多个细胞的平均值,或者只代表数量上占优势的细胞信息,然而在这些实验中并没有考虑到不同细胞的差异。

人类胚胎干细胞的基因表达是理解人体细胞和组织正常发育和疾病发生机理的重要手段。

目前,以核酸、蛋白质、代谢产物以及它们之间相互作用关系网络为研究对象的各种“组学”研究,已经逐渐成为人们发现生命本质以及探索其潜在分子机制的主要工具[6-8]。然而传统高通量测序方法通常需要大量细胞,使其具有很强的局限性,难以应用于自然界中难培养的微生物研究、罕见循环肿瘤细胞的转录组分析、胚胎发生早期的分化特征研究、肿瘤的非均质性和微进化研究等相关领域[9]。随着测序、细胞分离和全基因组扩增技术的发展,现如今,组学研究已经延伸到了单细胞水平[10]。在单个细胞个体上进行组学检测的单细胞测序技术能够解决上述研究方法的局限性。但有研究发现将基因组学,表观遗传组学,转录组学以及蛋白质组学应用于单细胞水平后,即使在同一组织中遗传相同的细胞之间,基因和蛋白质表达依然存在差异。目前这类只能检测单个细胞某个层面信息的研究方法得到的结果依然存在着偏差[11]。

对于癌症而言,其发生和转移涉及到基因组变化的各个方面,包括基因组DNA的变化、表观遗传修饰、基因表达以及它们之间复杂的相互作用。肿瘤内固有的强异质性使得使用大量细胞很难准确的定义基因组、表观遗传组和转录组之间的调控关系。然而单细胞方法通常被优化为只检查调控层次结构的一个方面,因此失去了在单细胞水平上探究组间调控的可能性[12]。所以现阶段需要一种能够做到在单细胞分辨率的基础上,实现同时对多种组学之间的互动关系进行解析的技术方法。

因此,单细胞多组学技术应运而生。在单个细胞水平,基因组DNA可用于测定单细胞基因组、DNA甲基化或染色质的可及性,而来自同一细胞的RNA可用于测定转录组和蛋白质组。利用这些不同的单细胞组学分析相结合,可以为同一个细胞创建多组学分析[13]。

在精准医疗时代,多组学方法能够整合来自不同组学平台的数据,多层面洞察疾病发生过程中的相互关系。单细胞测序技术可以挖掘组织的基因型和表型异质性,有望加深我们对生命健康和疾病产生时潜在机制的理解。通过将单细胞分析同转录组、基因组、表观遗传组、蛋白质组分析相结合,单细胞多组学方法不仅可以快速全面的研究单个细胞的独特的基因型和表型特征,并且只有在单细胞分辨率下才可以明显的观察到这种组合调控机制。

关键突破点:

通过对单细胞多组学分析方法的扩展和整合,我们可以获得多个通道的研究数据,并利用多组学特征来实现对单个细胞状态更全面的描述。结合不断发展的生物信息学算法和计算资源,不同组学收集到的实验数据使我们能够发现未曾挖掘和理解的多层面信息。

目前,单细胞多组学技术面临的主要挑战和发展机遇有:(1) 克服目前单细胞测序方法的局限性,促进更多单细胞组学测量方法的发展。(2) 需要进一步探索分离和标记同一单细胞中多种类型分子的新方法,这将有助于并行分析组学的数量,从双组学增加到三组学或更多。甚至可以包括单个细胞的多个功能参数。 (3) 相对于其它已成熟的实验方法,单细胞多组数据分析的计算方法才刚刚出现,需要进一步的优化。

此外,随着单细胞多组技术日益增长的产出量,原始数据处理所需的计算资源和时间将是数据分析灵活性的一个重要方面。简化和缩短数据处理所需的计算时间对于日益复杂的多维实验将非常重要。每个组类型的原始文件必须分别进行处理、对齐、过滤和质量控制,以考虑到单细胞测量固有的复杂性,如低信噪比、技术放大工件和技术变化[21]。然后将处理数据的每一组数据层分配回单细胞,并与数学和统计模型共同分析,以揭示调控模式。尽管这些新的计算方法还处于初级阶段,但由于它们没有实验条件的限制,可以为我们揭示更多深层次的生物调控关系网。目前单细胞多组学分析仍然需要更好的算法,使其可以从大量的单细胞分布图中推断出动态轨迹。同时单细胞多组学依旧面临的挑战有如何准确推断分支结构,怎样实现其中两个或更多个路径与单个点分离;实现重建“快速”转变,只有少数细胞可以被捕获;并且需要考虑到细胞可能同时遵循多个动态路径的事实。

战略意义:

单细胞多组学方法为系统了解生物多样性提供了宝贵的机会,通过整合DNA、RNA、蛋白质等多个组学水平的信息,在识别罕见的细胞类型及其特征方面的准确性达到了前所未有的水平。分析单个细胞在形态和功能上的复杂性,有助于更好地理解生物系统[22]。

单细胞多组学方法将在不同的领域发挥重要作用。首先单细胞多组学方法可以从异质细胞群体中识别细胞亚型。有研究表明,单细胞转录组测序的方法在识别细胞亚型如人类血液树突细胞、单核细胞和人类大脑皮层神经元方面是非常有效的[23-25]。

在表观遗传学修饰中DNA甲基化是发育调控的关键,细胞类型特异性强,但在生命周期内稳定。因此同时对表观基因组和转录组进行分析可以弥补单细胞转录组测序的局限性。不同的组学测量可以提供关于细胞身份信息,使复杂组织的解剖更加细致、准确。其次,可以利用单细胞多组学重建细胞谱系轨迹。了解多细胞生物在整个发育过程中的细胞谱系轨迹是发育生物学的关键。DNA突变,以及在细胞分裂过程中获得并传递给子细胞的表观遗传学修饰,可以用于谱系追踪,而匹配单细胞的转录组可以揭示细胞增殖和分化过程中基因表达的伴随改变和转录细胞命运的改变。

单细胞组学可以有效判断某类细胞的分化和谱系追踪[26]。细胞通过分化异步分支途径到达它们最终分化成的细胞类型。这是由分子变化所驱动,并且通过基因表达模式来完成的。因此,单细胞组学技术能将细胞演化过程发展重建为高维空间的轨迹[27]。相比较其它分子生物学技术单细胞多组学分析能发现其它方法难以处理的问题。解决传统高通量测序存在的局限性。随着分辨率和单细胞分析的产出量,我们可以找出无数的细胞状态,而不是少数的稳定和不同类型的细胞[28]。

多组学分析的另一个关键的应用是在医药上。短期内,受单细胞组学影响最大的可能是肿瘤。早期的研究使用单细胞qPCR来研究癌症干细胞的放射抗性的起源,并解析了结肠癌中细胞层次的异质性[29]。随着高通量方法的出现,单细胞基因组分析已被用于研究乳腺癌和急性淋巴细胞白血病中肿瘤的克隆结构和进化,并推断引起急性骨髓性白血病的最早突变的顺序。许多肿瘤、肿瘤部分区域在耐药、复发和转移、变化上不同,综合数据集可以提供足够详细的图谱来识别的肿瘤内差异的生物学基础[30]。

同时多组学谱系还可以应用于在生物技术和生态系统中研究不可培养微生物。这些细菌通常很难获得足够纯的群体进行大量分析,而单细胞的操作是综合分析的关键。

测量同一细胞内的细胞状态的不同方面的能力有望揭开细胞的基因组、表观基因、转录组、蛋白质组与代谢组之间的相关联系;可以揭示DNA甲基化、染色质于转录起始之间的复杂关系。随着多组学方法的进一步发展,单细胞多组学技术将在未来得到更广泛的应用。