单细胞 ATAC 测序

单细胞 ATAC 测序(Aaasay for transposase Accessible Chromatin with high throughput sequencing at the single cell level)翻译成中文是在单细胞水平上通过高通量测序技术来研究染色质开放程度(也叫染色质的可及性)。染色质开放程度(染色质的可及性),反映了染色质的转录活性状态,是研究基因表达调控的重要方向,在表观遗传图谱绘制、细胞分化和发育及各类疾病的发生发展研究中具有重要的作用。

对染色质可及性的研究是伴随着对染色体结构研究的发展逐渐兴起的。1971 年,Mirsky 首先使用 DNase 来研究染色质的结构,发现 DNase 对于存在与染色中的 DNA 仍然可以切割,表现出染色中的 DNA 对于 DNase 的可及性。1975 年,Burkholder 和 Weaver 研究发现 DNase I 对舒展状态的染色质的消化速率高于对压缩状态的染色质。同时指出 DNA 与染色质蛋白的结合程度的差异与这两种状态下染色质片段的功能相关。目前人们已经知道双螺旋的 DNA 与组蛋白结合后,会以染色质或染色体的形式形成高级空间结构。以人的基因组为例,每个组蛋白八聚体上缠绕有 146 个碱基对的 DNA。连接核小体与核小体之间的 DNA 序列称为连接序列。活细胞中染色质的结构总是处在动态变化中,在不同类型的细胞中,或在不同的生理条件和外界刺激下,细胞核中染色中呈现不同的结构和状态。这些结构和动态变化的状态表现形式之一就是染色质可及性的变化。

2015 年 4 月,Science 发表了 Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing [1] 的文章。同年 7 月,Nature 发表了 Single-cell chromatin accessibility reveals principles of regulatory variation [2] 的文章。这两篇论文先后提出利用单细胞 ATAC-seq 技术对染色质可及性进行检测,探索细胞转录调控机制,解决了以往存在的细胞异质性难题,成为 ATAC-seq 技术的一大突破。其中,后者将 ATAC-seq 与 Fluidigm C1 单细胞平台整合,利用微流控芯片完成捕获、裂解、转座、PCR 等实验过程,建立了自动化的单细胞染色质可及性图谱研究方法。

                         【图 ATAC-seq 与 Fluidigm C1 单细胞平台整合的实验流程 [2]】

作者首先对 254 个类淋巴母细胞进行了单细胞 ATAC 测序,将这些单细胞数据合并分析后得到的结果与群体细胞 DNase-seq 或 ATAC-seq 获得的染色质可及性图谱具有很高的相关性,单细胞水平的数据再现了一些群体细胞 ATAC-seq 数据反映出的染色质特征。

                                               【单细胞 ATAC-seq 与常规 ATAC-seq 的一致性 [2]】

为了进一步验证方法的可靠性,作者又用 scATAC-seq 的方法对 ENCODE 细胞系,包括 H1 人类胚胎干细胞、K562 慢性粒细胞性白血病细胞、GM12878 类淋巴母细胞、V6.5 小鼠胚胎干细胞、EML1 细胞(小鼠造血祖细胞)、TF- 1 细胞(人类成红细胞)、HL-60 cells(人类 promyeloblasts)和 BJ 成纤维细胞 HL-60 细胞进行了分析。结果发现在增殖细胞中,复制时序结构域(replication timing domains)的染色质可及性的变异性增加。同时,作者还发现不同的转录因子可以通过协同或者竞争性结合的作用促进或者抑制染色质可及性的可变性。通过此方法对作者对大量转录因子的 ChIP-seq 数据研究绘制出了转录因子协同作用改变染色质可接近性的图谱。此外,还发现与高可变性相关的转录因子的是细胞类型特异的,在单细胞中染色质状态与组蛋白修饰也与染色质可接近性变化相关。

                                               【转录因子通过协同或者竞争性结合作用促进或者抑制染色质可及性的可变性 [2]】

实验原理

2018 年 10 月,10X Genomics 推出的 Chromium 单细胞 ATAC 解决方案提供了一种全面的、可扩展的方法来研究分析单个样本中成百上千个细胞中染色质的开放情况。通过转座酶对混合的细胞核悬液进行核 DNA 的切割,然后使用微流控芯片将溶液中的细胞核包裹到油滴中,形成纳米级的凝胶珠状乳状液(GEMs)。采用 10X 条形码,对每个细胞核切割的 DNA 加上唯一的条形码。通过文库构建,测序,最终根据 10X 条形码将测序得到的序列关联到每个单独的细胞核上。

实验流程

1、转座酶切割核 DNA

细胞核悬浮液在包括转座酶的混合液中孵育。转座酶进入细胞核,优先在染色质的开放区域将 DNA 片段化。同时,将测序接头序列添加到片段化的 DNA 片段的末端。

                                                                      【转座酶切割 DNA 示意图】

2、GEM 生成及 Barcode 添加

在 Chromium Next GEM Chip H 芯片上,使包含有 barcode 的凝胶珠,转座酶切割后的细胞核,混合液(包括 ATAC buffer 和 ATAC 酶),以及油滴进行混合,最终生成 GEMs。为了达到每个油滴中包含有单个细胞核,需要对细胞核进行有限稀释,保证生成的大多数 GEMs(~90-99%) 不包含细胞核,而其余的为包含单个细胞核 GEMs。

GEMs 生成后,凝胶珠会溶解释放出含有(i) Illumina P5 序列、(ii) 16nt 10X 条形码序列和(iii) Read 1 (Read 1N) 序列的寡核苷酸。这些核苷酸序列会于片段化的 DNA,以及混合液进行混合。后续经过热循环后生成含有 10X barcode 的单链 DNA。经过孵育后,对 GEMs 进行破油处理,所有 GEMs 中的含有 10X barcode 的单链 DNA 混合在一起,并进行回收。

3、破油后的纯化

使用硅烷磁珠清除破油反应混合物中残留的生化试剂。固相可逆固定(SPRI) 珠子用于从样本中消除未使用的 10X 条形码。

4、测序文库的构建及质检

通过 PCR 将 P7 接头以及样本的标签(Index N)添加到文库的两端,最终形成包含有 P5 和 P7 接头序列的文库,用于 Illumina 桥式 PCR 扩增。

文库结构

                                                               【ATAC 文库组成示意图】

通过 Agilent TapeStation High Sensitivity D1000 ScreenTape 对文库进行质检,结果如下:

                           【Agilent TapeStation High Sensitivity D1000 ScreenTape 文库质检结果】

或者用 Agilent Bioanalyzer High Sensitivity DNA chip 来检测片段大小,结果如下:

                                 【Agilent Bioanalyzer High Sensitivity DNA chip 质检结果】

备注:

A、横坐标表示文库的片段程度,其中 0 代表核小体 free 的峰。1 代表包含有一个核小体的峰;2 代表包含有 2 个核小体的峰;以此类推。

B、核小体是由 DNA 和组蛋白形成的染色质基本结构单位。每个核小体由 146bp 的 DNA 缠绕组蛋白八聚体 1.75 圈形成。核小体核心颗粒之间通过 50bp 左右的连接 DNA 相连。加上两端的 P5,P7 接头,barcode,sample index,R1N 序列,长度大概如下:核小体 free 的峰长度 200 多 bp;1 个核小体的峰约为 300 多 bp;2 个核小体的峰约为 500bp,以此类推。

建议测序深度及参数

技术优势

▲流程精简时效快: 可检测单细胞转录调控区域中的开放性染色质。

▲通量高: 每个通道 500-10000 个细胞核。

▲效率高: 细胞核捕获率高达 65%。

▲适用范围广: 经验证适用于原代细胞,冻存细胞,新鲜组织等。

▲信息分析: 获取信息量大,可精细化分析。

▲同一份样本可实现单细胞 ATAC、mRNA、TCR/BCR 同时测序,并整合数据。

样本要求

▲类型: 新鲜组织,原代细胞,细胞系等。

▲来源: 血液提取、磁珠富集、流式富集、组织解离等。

▲样本量及其它质控要求:

▲样本的保存与运输:

(1)细胞悬液:最好现场制备,如要运输,建议使用伯豪生物自主研发的单细胞保护液,4°C 运输,48 小时内送达伯豪生物实验室。

(2)血液:EDTA 抗凝的全血,4°C 运输,2 小时内送达伯豪生物实验室;或提取 PBMC 后冻存,干冰运输。

(3)组织:建议使用伯豪生物自主研发的单细胞 ATAC-seq 组织保护液,4°C 运输,48 小时内送达伯豪生物实验室。

应用领域

▲干细胞 / 发育生物学

▲肿瘤学

▲免疫学

▲神经科学

数据分析

1、The Cell Ranger ATAC 分析结果

10X genomics 官方的 Cell Ranger ATAC 流程会输出一个 HTML 文件,其中包含数据统计结果和初步的分析结果。

A、基本数据统计(细胞数,每个细胞测到的数据的中位值,比对到 peaks 上的数据的比例等)

B、插入片段长度统计(包括核小体 free 的比例,单核小体的比例)

C、细胞聚类结果

2、Loupe Cell Browser 展示结果

基于 RNA 的细胞注释结果,对 ATAC 的细胞类型进行打分注释。