技术解读 ▏染色质调控区域的研究:对CHIP

发布日期:2021-10-22 09:29    点击次数:65

摘要

染色质调节区在许多疾病过程和胚胎发育中起着关键作用。表观基因组测序技术,如染色质免疫沉淀测序(CHIP-seq)和转座酶开放染色质高通量测序(ATAC-seq),使我们能够通过检测特定的染色质状态及其相应的转录因子,在时间和空维度上分析细胞和组织的基因组调控模式。随着染色质免疫沉淀芯片的发展,出现了大量表观基因组分析技术,如CHIP-seq、DNase-seq、ATAC-seq等。单细胞测序的出现彻底改变了下一代测序,其在单细胞表观遗传学中的应用迅速丰富。表观基因组测序技术从低通量发展到高通量,从批量样品发展到单细胞范围,为科学家从不同角度解读生命带来了前所未有的好处。本文简要介绍了表观基因组生物学的背景知识,讨论了表观基因组测序技术,特别是ChIP-seq和ATAC-seq技术的发展及其在科学研究中的应用。最后,我们对未来的应用和挑战提出了一些看法。

关键词:染色质调控区,表观基因组测序,单细胞,发育生物学。

介绍

DNA被组蛋白包裹,组蛋白以各种方式被修饰。组蛋白乙酰化是染色质修饰中最具特征性的修饰之一,与局部染色质结构的开放和转录激活有关(如H3K27ac与增强子有关)。与组蛋白乙酰化相比,组蛋白甲基化在功能和形式上更加多样化。组蛋白甲基化包括H3K4me1、H3K4me3、H3K9me3、H3K36、H3K79等。赖氨酸的特异性甲基化可以存在于具有不同功能的单甲基化、双甲基化或三甲基化中。抑制性组蛋白甲基化,如H3K9me3,与凝集性和结构性异染色质高度相关。同时,活跃的组蛋白甲基化,如H3K4me3,有助于激活转录。一些研究甚至揭示了一类既有活性又有抑制作用的二价染色质,表现出H3K4me3和H3K27me3的重叠模式。这个稳定基因的二价标签的发现是意想不到的,也是非常重要的。例如,它可能是从母体向受精卵过渡的一个关键里程碑,提供了关于“中间”状态的第一条线索。此外,二价染色质并不是胚胎干细胞独有的,也存在于其他类型的细胞中。在更复杂的情况下,在一些组织中充当启动子的元件可以在其他组织中充当增强子,称为CRID(具有动态特征的顺式调节元件),并且相同的调节元件可以同时具有启动子和增强子特征。

更多的组蛋白修饰包括磷酸化、泛素化、糖基化和ADP核糖基化。目前,组蛋白修饰的探索仍存在以下问题:

组蛋白表面的修饰通常是动态的:一些修饰可以在细胞受到刺激后的短短几分钟内被添加和去除,因此在特定条件下的给定时刻一组细胞中检测到的组蛋白修饰实际上仅部分代表了潜在的修饰类型。用于检测组蛋白修饰的抗体对于许多表观遗传染色质测序技术是必不可少的:例如,在CHIP-seq中,需要对组蛋白和转录因子进行抗体特异性检测。组蛋白修饰的异染色质形成和扩散机制以及组蛋白修饰的“记忆”和“消退”的研究还很少。组蛋白密码的概念在许多情况下不能广泛用于准确描述和预测特定的生物学现象.某些组蛋白修饰在某些基因组区域是活跃的。相反,在其他区域有抑制作用:例如,H3K9基因座的甲基化在启动子区域是抑制的,而在编码区是活跃的。

与单一组蛋白修饰不同,染色质调控区是染色质生物学功能的更高诠释,它结合了组蛋白修饰、转录因子结合和基因组元件的调控功能。著名的路线图表观基因组联盟领导了一项大规模的人类表观基因组研究,提供了调控元件功能状态的详细和准确的描述和分类。此外,通过将染色质的表观基因组状态与现有的全基因组甲基化信息和RNA-seq的基因表达谱相结合,科学家可以从多维角度解释特定组织的表观基因组现象。

许多关于染色质动力学的研究不仅需要获得组蛋白修饰和基因组调控元件的信息,还需要正确理解转录因子和染色质之间的相互作用,这往往是理解发育和疾病进展所必需的。一些与染色质调节区相关的转录因子需要特定的组蛋白修饰,而另一些转录因子需要染色质开放和其他激活剂的帮助。一些转录因子和调节区的结合促进了其他转录因子的聚集。可能促进染色质开放,进而影响转录因子的结合。对相互作用机制的深入研究仍然有限。最近的研究通过构建合成读写模块探索表观遗传调控机制,这将有助于我们更好地理解表观遗传的基本原理。

染色质动力学研究技术进展。

基于芯片的研究方法。

应用于大规模表观遗传学分析的第一项技术是染色质免疫沉淀(CHIP),然后是微阵列基因芯片杂交(chip)(CHIP-chip),它使科学家能够检测整个基因组中DNA-和蛋白质之间的相互作用。CHIP-chip是基于微阵列杂交技术,在高密度芯片上种植大量覆盖基因组或特定区域的探针。然而,这种方法存在分辨率低、对探针设计要求高、信号偏差大、难以广泛应用于更多物种等缺点。

与chips相比,染色质免疫沉淀测序(CHIP-seq)具有分辨率高、噪声低、覆盖范围大等优点。随着第二代测序成本的快速下降,CHIP-seq将成为研究基因调控和表观遗传学不可或缺的工具之一。除了更好地识别序列基序,芯片序列还可以用来寻找关键的转录因子、增强子和其他调控元件。

传统CHIP-seq技术。

对于DNA结合蛋白来说,CHIP-seq实验的目的是获得大量与特定蛋白结合的DNA。该过程包括几个步骤(图1A):首先用甲醛将DNA和蛋白质原位交联,然后将DNA超声处理成200-600bp的小片段;然后用抗体免疫沉淀特异性DNA蛋白复合物;最后,DNA交联,释放的DNA经过末端修复、接头连接等文库制备步骤。最后,进行测序。

但是CHIP-seq有一些局限性:聚合酶链式反应有偏差;聚合酶链反应扩增的长度是有限的;裂解和测序过程中的气相色谱偏差;由于免疫沉淀过程中的大量损失,需要105,107个细胞。以及可能由甲醛交联过程引起的隐藏表位。甲醛可以将转录因子与DNA交联,使其在体内保持结合状态,但也可能掩盖转录因子的表位,产生假阳性结果。甲醛交联芯片也叫X-CHIP。另一方面,天然CHIP(N-CHIP)没有隐藏表位的问题,在细胞数量较少时可以使用。该方法摒弃甲醛固定,利用微球菌核酸酶消化染色质。MNase可以快速、温和地切断染色质DNA,最大限度地保持原始染色质结构与靶蛋白的结合,提高CHIP结果的可靠性。但是,当靶蛋白与DNA的结合力不强时,这种方法可能会导致许多结合位点的丢失,因此通常用于组蛋白CHIP而不是转录因子。对于抗体依赖的表观遗传测序技术,选择合适的抗体往往是最关键的一步。在选择单克隆抗体或多克隆抗体时,单克隆抗体可能因受到其他蛋白成分的干扰而产生微弱信号。相反,多克隆抗体可能会产生不必要的假阳性。

图1芯片序列和ATAC序列的工作流程。答:在CHIP-seq中,染色质用甲醛交联,超声处理得到200-600个碱基对的DNA片段。然后,目标DNA-蛋白质复合物可以被抗体免疫沉淀。文库制备步骤:末端修复,A尾和接头连接,文库测序。B.ATAC-seq使用高活性tn5转座酶来鉴定开放染色质区域,开放染色质优先插入可及的染色质,并用测序适配器标记这些位置。

微型电池的芯片技术。

传统CHIP-seq的主要限制因素是需要大量的细胞(105,107个细胞)。在过去的几年中,各种方法被用来优化实验以测量少量细胞。化学印迹结合染色质免疫沉淀和Tn5转座酶制备测序文库。快速和低成本的文库制备允许组蛋白CHIP-seq使用10,000个细胞。Uli-NChIP是一种基于超低输入MNase的天然芯片,通过调整NChIP程序,可以生成从103个胚胎干细胞到106个胚胎干细胞的高质量组蛋白修饰图谱。基于微流控振荡洗涤的CHIP-seq(MOWChIP-seq)甚至可以应用于仅100个细胞的组蛋白修饰的全基因组分析。虽然这些方法可以在少数细胞(如H3K4me3)中产生相对准确的组蛋白修饰图谱,但它们对许多转录因子无效,因为基因组上的结合位点很少。

像CHIP-seq一样,target Cut&Run用于检测DNA和蛋白质之间的相互作用。用融合到蛋白A/G上的Mnase代替甲醛交联和超声波切碎,原位切割释放靶DNA片段,从而显著提高信噪比,可在少至100~1000个细胞中使用。超低切割和运行(ulicut & run)将进一步将该方法提高到单细胞水平。研究人员发现,通过这种方法,hESC细胞中CTCF的结合位点集中,而H3K4me3占据了相对较宽的区域。同时,还准确描述了SOX2和Nanog等重要转录因子在早期胚胎发育中的结合模式。

Cut&Tag是另一种可以检测低细胞输入样本甚至单细胞中DNA-蛋白质相互作用的技术。Cut&Tag使用与蛋白A/G融合的Tn5转座酶(pA/G-Tn5)切割DNA,而不是与蛋白A/G融合的Mnase,对核酸酶的质量要求较高。核酸酶pA/G-Tn5具有高活性、高灵敏度和对微量DNA的高亲和力,能有效捕获少数细胞中有限的结合位点。Cut&Tag的另一个特点是添加刀豆球蛋白a后,所有的文库制备步骤都在同一试管中进行。因此,测序数据具有低背景。因此,与切割切割和运行相比,切割和标记不需要末端修复和额外的接头,这使得它更容易和更有效。PA/G-Tn5可以在不同条件下结合和切割非特异性开放染色质,因此Cut&Tag通过改变缓冲液组成,可以同时结合一些开放染色质和特异性转录因子结合位点。然而,在更科学的背景下,非特异性的脱氧核糖核酸切割会干扰转录因子的测定。在这种情况下,有必要结合已知的开放染色质数据来消除这些干扰。一般不建议使用过于复杂的数据,因为组合其他数据消除背景通常会带来批量效应。

单细胞芯片

与不能检测单细胞染色质特征的batch CHIP-seq不同,单细胞ChIP-seq(scChIP-seq)有助于研究异质细胞群体的遗传多样性,了解肿瘤群体的进化。单细胞芯片(Single cell ChIP-seq,Drop-CHIP)将微流体设备与单细胞DNA相结合,使研究人员能够获得每个细胞相对较低的覆盖率图。实验程序包括四个步骤(图2a): 1)液滴形成:将包裹在液滴中的每个细胞与裂解物和MNase混合;然后细胞分裂成液滴,它们的染色质碎裂。第二个编码液滴包含连接染色质片段的DNA代码。将两个液滴混合以形成索引微反应器。2)液滴中的核小体编码区。3)核小体编码区的免疫沉淀。4)文库构建和测序。下游数据分析流程类似单细胞RNA-seq。ScChIP-seq是基于染色质功能的多样性和每个群体特有的染色质特征的鉴定,实现细胞群体聚集。例如,H3K27me3标记在某些细胞中的丢失可能与化疗耐药有关。然而,由于单个细胞生成的数据过于稀少,需要数千个细胞才能获得良好的聚类结果。

表观基因组学工具,包括剪切&运行和剪切&标记,大大减少了细胞输入,但根据具体情况,其性能可能不如CHIP-seq。单细胞CUT&Tag和单细胞ATAC序列(scATAC-seq)都依赖于一种叫做Takara ICELL8的特殊装置。基于微流控的Drop-CHIP每个细胞只能产生约1000个数据,但其应用受到数据稀疏和设备昂贵的限制。因此,迫切需要一种适用范围更广、性能更强、成本更低的低丰度细胞甚至单细胞的CHIP方法。基于单细胞同时索引和标记的CHIP-seq技术(sc-itChIP-seq)是一种基于芯片的高分辨率技术。它的实验步骤是通过FACS(荧光激活细胞分选)打开固定细胞/天然细胞的全基因组染色质,使Tn5可以均匀地切断DNA。通过免疫沉淀富集释放的DNA片段(图2b)。单细胞的DNA-蛋白质相互作用可以通过解复用和熔化编码获得。所有的库制备步骤都在同一个试管中进行,这大大减少了损失。Sc-itChIP-seq可用于鉴别分化过程中的谱系特异性增强子和关键转录因子。利用这种方法,科学家成功地确定了年轻小鼠胚胎干细胞的表观遗传位点,并揭示了决定心脏祖细胞命运的谱系特异性增强子的重编程事件。鉴于sc-itChIP-seq不依赖昂贵的设备,其在实验室的应用比以前的scChIP-seq更广泛(表1)。

结合条形码和靶向染色质释放(CoBatch)不仅可以描述细胞输入相对较低的样品的表观遗传图谱,而且可以应用于数千个自然或固定状态的高信噪比单细胞。这种方法使用了一种叫做PAT的酶,它是蛋白质A和Tn5转座酶的N端的融合。将与抗体一起孵育的细胞分布在孔中(每孔200~2000个细胞),然后加入不同的PATs进行第一轮实验。将所有细胞汇集并重新分布到不同的孔中(每孔20~25个细胞),最后用不同的PCR引物进行第二轮扩增(图2C)。利用coBatch生成的单细胞数据,研究人员成功实现了内皮细胞、间充质细胞等细胞类型的高通量鉴定,揭示了内皮细胞群体的异质性。然而,这种方法的缺点是不能直接应用于低至十几个细胞的样品,如植入前胚胎。

核小体定位与染色质开放性核小体定位和染色质开放。

研究开放染色质区最经典的技术之一是脱氧核糖核酸酶ⅰ超敏反应位点测序。DNaseI具有内切酶活性,通过控制切割效率可以获得合适长度的开放染色质片段。脱氧核糖核酸酶用于切割基因组中的脱氧核糖核酸酶敏感部分。然后对消化后的片段进行扩增,分析测序数据中的峰,得到相对开放的染色质区和蛋白质保护区的信息,这些区域通常是转录因子的结合位点。

MNase-seq用于探测核小体的定位,MNase消化用于染色质片段化,无需交联。与脱氧核糖核酸酶不同,脱氧核糖核酸酶与开放染色质结合后,既有核酸外切酶活性,也有核酸内切酶活性。它可以直接消化DNA,直到遇到特定的因子和核小体,然后去除接头DNA,这使得MNase-seq非常适合探索核小体的定位。Mnase-Seq需要知道合适的酶条件,这将不可避免地导致不可控的混杂因素,例如序列结合和酶活性的不同条件。用ChIP-seq、DNase-seq和MNase-seq测定转录因子图谱、染色质开放度和核小体定位。它们都需要大量的输入材料,产生对细胞异质性不敏感的“平均”图谱,极大地限制了这些技术在一些稀有珍贵样品中的应用,如早期胚胎。此外,这些技术涉及复杂耗时的样品制备和文库构建,不能直接研究核小体定位、染色质开放和转录因子定位之间的相互作用。具体来说,最大的限制是:

1.高细胞输入掩盖了细胞群体间的异质性;输入材料的要求限制了DNase-seq和MNase-seq在特定临床样本中的应用,使得个体化表观基因组学研究难以实现。

2.为了获得所需数量的细胞,通常在体外培养细胞进行扩增。但体外培养不能完全模拟体内条件,会进一步增加可能导致染色质状态改变的外部因素,从而增加实验失败的风险。

ATAC序列的发展

高通量测序(ATAC-seq)在转座酶开放染色质测定中的应用,成功实现了开放染色质区、核小体定位和调控基序的同时鉴定,所需样本减少到5005000个细胞。利用模体推断,科学家成功推断出B细胞系中DNA结合蛋白的结合位点。同样,ATAC序列有一个相对简单有效的“两步”文库制备程序:转座和聚合酶链反应(图1b)。在ATAC-seq实验中,分离后收集细胞核,用Tn5转座酶将细胞核中的染色质分段并连接到测序连接器上,大大简化了实验过程。紧密包装的染色质DNA不能进入转座子,而开放区域的染色质DNA被转座子随机插入并片段化。收集片段的脱氧核糖核酸用于随后的分析。ATAC-seq最重大的创新是Tn5转座酶的应用:Tn5转座酶的转座活性低。为了在科学研究中更好地利用它,经过定向改良,可以成为一种对DNA亲和力更高的高活性Tn5转座酶。Tn5转座酶可以与设计好的接头在体外组装形成活性转座子复合物。虽然Tn5转座酶不可避免地会因序列依赖的组合而产生偏差,但这种转座偏差可以通过开发计算工具来纠正。

ATAC序列具有效率高、细胞输入要求低的优点,但其对不同类型样本的适用性仍然有限。为扩展应用而生产的ATAC衍生技术包括fast-ATAC、Omni-ATAC和miniATAC-seq(图3)。例如,针对血样优化了fast-ATAC,使用含有洋地黄皂苷的转座缓冲液,将渗透和转座两个步骤合二为一。它不仅增加了每个细胞的片段产量,还大大降低了线粒体片段的读取比例。Omni-ATAC可应用于各种细胞类型的冷冻样品和长期保存。进行了改进,包括各种去污剂,裂解后用吐温-20洗涤细胞,用磷酸盐缓冲盐水提高转座反应的信噪比。所有这些改进使得Omni-ATAC能够应用于各种细胞系、组织类型和长期保存的冷冻样本,同时提高了数据质量。miniATAC-seq主要针对DNA纯化步骤和裂解缓冲液(胚胎的最佳NP-40浓度)进行优化,甚至可以通过高质量测序数据应用于20个细胞(如早期胚胎)。ATAC序列程序的优化也被广泛应用于生物样本库中的神经组织和细胞。

ATAC-seq可以测量少至500个细胞的样本,但它无法在单细胞水平上破译细胞之间的差异。单细胞测序技术的出现使我们能够了解更详细的单细胞水平的活动。从单细胞转录组测序中获得的信息非常有限,因此在单细胞水平上进一步研究调控元件的表观基因组动力学对于发现更详细的细胞分化和发育机制非常重要。2015年,一种用于测序转座酶中开放染色质的单细胞组合分析(sci-ATAC-seq)被开发出来,它可以同时测序大量的单细胞。在这种方法中,细胞被标记,染色质开放在单细胞水平上被测序。首先,将96孔板中的所有岩心用标记有特定代码的Tn5转座酶编码,然后将这些岩心合并并重新分布到新的一组井中。因此,可以通过PCR扩增添加第二编码信息(图4a)。首个基于微流控平台的scATAC-seq技术与Fluidigm单细胞平台C1(集成流体回路)集成(图4b),是一种研究单细胞染色质开放度的方法。与sci-ATAC-seq相比,它可以捕获每个细胞的更多数据,从而开启了对细胞间调节子(调节体)多样性的探索。在Chromium平台(10×Genomics)上执行的液滴scATAC-seq(10×ATAC-seq)前所未有地大大提高了scATAC-seq的实验能力(图4c)。在微流体中加入单核悬浮液,促进凝胶珠的形成。在每个GEM中,新设计的凝胶珠寡核苷酸含有29 bp的测序接头、16 bp的特异性序列(用于标记液滴)和1 N的前14 bp(用于线性扩增反应的引物),可以实现数千个细胞在实验中被测量。利用10×scATAC-seq,研究人员获得了肿瘤微环境中免疫细胞中差异开放染色质的更精确定位。为了解释scATAC-seq数据相对于单细胞RNA-seq数据的不足,科学家们开发了各种计算工具,如chromVAR、Cicero、cisTopic、APEC等。

将ChIP-seq和ATAC-seq结合。

当比较两个或多个样本时,仅通过ChIP-seq可能很难找到有意义的调控元件。在这方面,ATAC序列具有高分辨率和高信噪比的优势,这使得研究人员能够识别差异调节序列,如增强子。结合ChIP-seq和ATAC-seq可以更容易地确定明显的峰。虽然检测开放染色质的方法,如脱氧核糖核酸酶-序列和ATAC-序列,可以帮助推断基因组特征,但ChiP-序列仍然是不可替代的。所有这些技术都间接检测了转录因子与DNA的结合位点,这意味着从富集的基序推导出的转录因子的作用位点仍需进一步验证。单独使用ATAC序列的可能限制是:

并非所有的染色质调节剂都具有相应的基序,例如染色质重塑蛋白的调节剂并不具有特异的DNA序列。相反,染色质重塑蛋白和核小体之间的相互作用通常是早期胚胎发育以及细胞命运决定的重要因素。单独的开放染色质信息不能用来推断这些因子的结合情况。一些基序有可能被多个序列特异性转录因子结合。 一些同源转录因子以相似的基序模式结合,在许多情况下,开放染色质直接分配给特定的单个转录因子的可能性较低。直接检测特定转录因子和DNA之间相互作用的结果通常更可靠。

与直接决定特定DNA-蛋白质相互作用的ChIP-seq相比,ATAC-seq检测到的全基因组染色质开放度代表了染色质调控模式的另一个层次。因此,ATAC-seq和ChIP-seq的结合将有助于科学家对染色质调控动力学及其生物学意义有更全面、更深入的了解。

图4单细胞ATAC-seq:a.SCI-ATAC-seq的组合标引方法。第一个序列是由Tn5转座酶引入,第二个索引通过使用包含第二个序列的引物扩增而引入。b.基于集成射流电路(IFC)的scATAC-seq。在使用微流体平台(Fluidigm)的scATAC-seq中,在IFC上转座和PCR后,收集文库,并用细胞识别序列引物进行PCR扩增。然后,将单细胞文库汇集在一起,并在高通量测序仪器上进行测序。c.基于液滴的scATAC-seq(10×ATAC-seq)工作流程在Chromium平台(10倍基因组学)上实现。GEM:乳剂中的凝胶珠。图4单细胞atac-seq的组合索引方法:a. sci-atac-seq。第一个序列是由Tn5转座酶引入的,第二个指数是通过使用含有第二个序列的引物进行扩增而引入的。b .基于集成流体电路(IFC)的scATAC-seq。在使用微流控平台(Fluidigm)的scATAC-seq中,在转座和对IFC进行聚合酶链反应之后,收集文库并用细胞识别序列引物进行聚合酶链反应扩增。然后,收集单细胞文库并在高通量测序仪上进行测序。基于微滴的scATAC-seq(10×ATAC-seq)工作流在Chromium平台(10倍基因组学)上实现。宝石:乳液中的凝胶珠。

应用重置对生物问题的理解。

ChIP-seq和ATAC-seq方法提高了我们对早期胚胎染色质重塑的认识。

哺乳动物胚胎发育涉及整个基因组的表观遗传变化,包括DNA甲基化、组蛋白修饰、开放染色质和染色质构象。至关重要的是,许多基因组调控元件(如启动子、增强子、绝缘体和基因座控制区)通过与细胞类型特异性转录因子相互作用来指导胚胎发育。同样,这些调控元件之间的长期相互作用也很有趣(图5a)。通过创新性地优化ChIP,它可以用于非常低细胞数(如胚胎)的组蛋白修饰和重建(图5b)。在早期小鼠胚胎中,H3K4me3经历了广泛的重编程事件,在合子中消失,并在后代中再次重建,伴随着合子基因组激活(ZGA)。因此,优化ChIP-seq在胚胎中的应用可能有助于揭示哺乳动物组蛋白修饰从亲本到后代的详细过程,即受精前后亲本修饰方式的差异。更重要的是,将改进的ATAC-seq方法应用于胚胎组织,有助于在胚胎发育的关键阶段定位全基因组的染色质开放度。例如,在植入前胚胎中,ATAC序列用于揭示ZGA高分辨率染色质变化和小合子基因组激活的时间动态。额外的表观基因组研究也显示了胚胎发育不同阶段独特的染色质状态。这些发现为人类胚胎发育的进一步研究和未来的临床指导提供了有价值的线索。更多的问题,如调控染色质状态转换的关键因子和转座子,还有待发现。

用单细胞探索器官的发育过程。

表观基因组测序技术在实验系统中追踪发育轨迹、探索细胞命运决定机制方面具有不可替代的作用(图5c)。单细胞水平的ChIP-seq和ATAC-seq有助于全面解决组织器官的发育动力学问题。2018年,scATAC-seq被应用于小鼠前脑发育不同阶段的集群细胞,并用于识别从开放染色质推导出的关键调节因子。将器官模型中的ChIP-seq、ATAC-seq和DNase-seq与转录组数据相结合,将有助于揭示特定细胞的发展趋势,发现关键的转录调控因子,识别易患病的细胞群。单细胞转录组和ATAC序列在器官发育中的多组学整合可以为疾病的临床治疗提供坚实的基础。例如,通过充分了解人类海马发育的关键时间点和基因调控网络,研究人员提供了与帕金森病、阿尔茨海默病和亨廷顿氏病病理相关的潜在细胞群的信息。

除了神经生物学研究,染色质动力学分析还揭示了肌肉发育、乳腺发育和心脏前体细胞的命运。对单细胞染色质动力学的精细研究将有助于创建未来人类器官发育的全球模型,并使我们能够追踪每个组织和器官的胚胎起源。

利用单细胞评估癌症的复杂性用单细胞来评估癌症的复杂性。

目前对高度异质性肿瘤组织的认识有限,包括肿瘤微环境的差异、原发癌与转移性肿瘤的差异、肿瘤亚克隆的进化等。肿瘤微环境中的免疫细胞通常对癌细胞的免疫逃逸和浸润非常重要。ScATAC-seq及其扩展应用将有助于揭示肿瘤发展中表观遗传学的异质性,并为治疗提供潜在靶点(图5d)。例如,scATAC-seq的应用已经确定了肿瘤微环境中恶性基质和免疫细胞的调控网络。通过检测单细胞水平的免疫细胞发育动态,比较免疫治疗前后患者肿瘤微环境中T细胞的衰竭情况。可以确定对免疫疗法有反应的关键调节性T细胞群。对同一细胞中的ChIP-seq、ATAC-seq和DNA突变图谱进行综合分析,将使科学家能够发现新的癌细胞亚克隆,从而进行个性化的临床试验。因此,在单细胞水平理解染色质调控模式将显著加速癌症治疗的生物医学进展。

ATAC序列的延伸技术也可以为肿瘤异质性提供新的见解。转座酶开放染色质分析(ATAC-see)具有视觉功能,通过用荧光标记开放基因座,有助于原位成像开放染色质。例如,通过使用ATAC-see和荧光原位杂交,科学家提供了染色体外DNA和ATAC-see荧光信号共定位的物理证据。根据ATAC-seq和MNase-seq的数据,结果表明ecDNA是高度可及的,这可以解释为什么ecDNA上的癌基因可以大量表达。因此,ChIP-seq和ATAC-seq技术的适配可以为靶向治疗提供新的方向,为癌症的异质性提供影像学物理证据,从而使科学发现更加全面可靠。

结论和未来展望。

scRNA-seq和scATAC-seq的组合。

RNA-seq、ATAC-seq和ChIP-seq通常结合起来构建一个完整的调控网络。尽管已经开发了许多算法来整合多个组学数据,但很难评估这些算法的性能以及它们是否完全保留了生物学差异。近年来,越来越多的研究证明了在同一细胞中并行分析多种形态的潜力。基于droplet platform (SNARE-seq)的单核染色质开放和mRNA表达测序,通过双组学捕获,可以同时对单个细胞内的转录组和染色质开放进行测序,并能适当关联两种方法的结果,获得基因表达的调控。Sci-CAR是一种基于组合指数的方法,可以将sci-ATAC-seq和sci-RNA-seq结合起来测定成千上万个单细胞中染色质开放度和mRNA(CAR)。Pairedseq是一种超高通量方法,用于平行分析数百万个单个细胞中的转录组和可用染色质。该方法采用基于连接的组合索引策略,在数百万个细胞中标记Tn5转座酶产生的开放染色质片段和RNA逆转录产生的cDNA分子。与SNARE-seq和sci-CAR相比,Pair-seq具有更高的吞吐量,这使得在生物尺度上分析基因调控程序成为可能。与转录组相比,开放染色质的一个明显优势是它提供了基因的表达状态和调控元件之间的相互作用网络。因此,结合ATAC序列和核糖核酸序列将解决更显著的生物学问题。例如空基因的表达模式与顺式调控元件高度相关,因此各个细胞之间存在差异。基于这一前提,这些异构小区如何协同工作,构建一个全面的蜂窝通信网络,就耐人寻味了。

单细胞染色质检测的前景和局限性。

与来自细胞群体的开放染色质数据相比,scATCA-seq信号具有二进制性和稀疏性,因此需要一个新的分析框架来解释大量数据的根本差异。一种可行的方法是从许多单个细胞中收集信息,以确定细胞间染色质变异的决定因素。由于每个片段的末端代表开放染色质的区域,因此可以分析来自这些片段的组合信号,以确定基因组中富含开放染色质的区域,这可以被认为具有调节和功能意义。然而,理论上,这种方法的一个缺点是它不能识别只出现在稀少群体中的稀有峰。目前scATAC-seq方法的主要局限性之一是只捕获了单个细胞中开放染色质位点的一个子集,很多位点在实验和计算过程中可能会丢失或未被检测到。在不久的将来,似乎不太可能实现更全面的覆盖。每个小区更高的覆盖率将解决新的问题。例如,单个细胞中两个等位基因之间的染色质可及性是如何不同的,或者单个细胞中开放的染色质区域是如何相互关联的,仍然令人困惑。

空之间表观基因组的前景。

Tn5转座酶广泛应用于染色质可及性测序、转座子插入线性扩增,甚至检测与冠状病毒共感染的潜在病原体。对于个性化应用,Tn5可以退火各种适配器,这是创新研究和设计的一个重要方面,例如将适配器与荧光结合以促进染色质成像。此外,由于未公开的试剂严重限制了新应用的开发,Tn5的改进设计将进一步实现高通量和大规模实验。如果科学家能够有效地对文库制备过程进行个性化,将使表观基因组测序技术从更大规模的项目中受益,如DNA元素百科全书。例如,利用空inter trans tome的原理,一旦Tn5被广泛使用,就有可能直接对样品进行测序,而无需细胞解离和离心,从而保持细胞的原始状态并显著减少损失。此外,空之间的表观基因组可以通过将单个细胞的染色质状态映射到它们的位置信息来实现。虽然许多研究为组织器官的发育获得了良好的时间节点,但进一步提高发育研究的空之间的分辨率,如胚胎器官不同阶段细胞的迁移轨迹,仍然是一个挑战。

它不仅需要细胞在空之间的定位和迁移,还需要分子水平上空之间的动力学。细胞内全基因组染色质构象变化是调节细胞行为的重要机制。HiChIP技术将芯片技术与染色质构象捕获技术相结合,成功解决了染色质结构的动态问题,具有较高的灵敏度和分辨率。因此,随着表观基因组动力学分析技术的进一步发展和完善,将不同组学和实验技术相结合进行多维生命科学研究具有广阔的前景和诱人的前景。更全面的网络还可以更好地理解单个细胞中各种调节因子的相互作用。

原始文献:马,s,张,y。色谱调控图谱:对芯片序列和atac序列发展的见解。摩尔生物医学1,9 (2020年)。doi.org/10.1186/s43556-020-00009-w.

综述科普|染色质调控区域的研究:对CHIP-seq和ATAC-seq发展的深入思考

有问题请留言,一看到就回复。