除了经典的核糖核苷酸 A、U、C、G 之外,生物体中还存在大量可遗传的修饰核苷酸,即所谓的表观遗传学修饰。它们像栅栏上的彩灯一样装饰着 RNA,调控着基因表达、mRNA 剪接和**发生等各种重要的生命过程。
迄今为止,科学家们已成功鉴定出170多种表观遗传学修饰,但这些或只是冰山一角。为实现转录组水平全修饰图谱的绘制,Nature Cell Biology 封面综述和分子生物学家们纷纷呼吁发展直接对所有RNA表观遗传学修饰进行定位和定量的方法。
RNA 修饰分析可采用薄层色谱(TLC)、高效液相色谱-紫外分光光度法(HPLC-UV)或高效液相色谱-质谱法(HPLC-MS)进行。这些方法可以同时测量大量的 RNA 修饰,但难以提供序列信息。基于二代测序(NGS)的方法依靠抗体**沉淀或化学修饰可以实现全转录组 RNA 修饰图谱绘制。这些方法可检测的修饰种类有限,且通常只针对一种特定的修饰,仍有大量 RNA 修饰无法被检测或被定位。
新兴的纳米孔测序技术可直接对长链 RNA 进行测序,无需逆转录和 PCR 扩增,有望直接读取 RNA 上的所有修饰信息。但由于孔道分辨率有限,修饰核苷酸引起的离子电流变化还与其周围序列有关,这为准确判断修饰的类型、位置及多种修饰的同时检测带来了挑战。
近日,南京大学化学化工学院黄硕教授团队在 Nature 子刊 Nature Nanotechnology 上发表了题为:Identification of nucleoside monophosphates and their epigenetic modifications using an engineered nanopore 的研究论文。
该研究构建了一种高分辨的耻垢分枝杆菌膜蛋白A(MspA)纳米孔,可以准确识别所有的经典核苷酸和它们的主要修饰。野生型 MspA 纳米孔是天然的八均聚体,如何在其内部引入**的功能位点尚未被报道。
该研究团队通过原核共表达体系,在八聚体中成功引入了一条含半胱氨酸突变的单体,实现了异质 MspA 纳米孔的构建。随后通过马来酰亚胺苯硼酸与巯基的迈克尔加成反应,进一步在孔道内引入了**的苯硼酸适配体。利用苯硼酸和核苷酸上顺式二醇的可逆相互作用,研究团队实现了对四种经典核苷酸(C、U、A、G)的完全区分,其效果远优于现有的报道,充分证明了异质 MspA 孔道检测核苷酸的可行性及高分辨率。
研究团队进一步将该方法应用于RNA表观遗传学修饰的检测,实现了高达7种常见修饰核苷酸的同时检测,包括5-甲基胞苷(m5C)、N6 -甲基腺苷(m6A)、N7-甲基鸟苷(m7G)、N1-甲基腺苷(m1A)、肌苷(I)、假尿嘧啶(Ψ)和二氢尿嘧啶(D)。
这是纳米孔**报道如此多种核苷酸修饰的直接检测与**区分,充分展示了 MspA 对微小结构差异甚至修饰异构体的**分辨率,该方法理论上适用于各种核苷酸、核苷酸修饰及核苷酸衍生物的检测。
随后,研究团队针对 RNA 表观遗传学修饰信号数据库开发了机器学习算法辅助纳米孔事件的自动识别。通过选取每种核苷酸500个标准事件作为训练集和对各种机器学习模型的评估,研究团队获得*优的线性 SVM 模型。该模型对十一种核苷酸区分的准确率达到99.6%,并且对混合的核苷酸样品可以进行成分鉴定,为真实环境下核苷酸的检测提供了自动化数据分析工具。
为直接检测 RNA 上的修饰,研究团队开发了一种“化整为零”的天然 RNA 全修饰图谱检测方法。他们利用核酸外切酶将天然 RNA 消化成单核苷酸,然后使用高分辨纳米孔检测和机器学习分析,获得消化产物中核苷酸的组成和丰度,*终重构出原始 RNA 的序列组成和修饰信息。利用该策略,研究团队成功检测到了胃肠癌病人 microRNA 中的 m5C 和 m6A 修饰,为直接鉴定小 RNA 中的表观遗传学修饰提供了快速方便的单分子分析方法。
为了进一步拓展该策略的通用性,研究团队将其应用于 tRNA 修饰图谱的检测。作为高度修饰化 RNA 的代表,tRNA 中已经鉴定出了90多种修饰类型。以酵母苯丙氨酸 tRNA 为例,成熟的酵母苯丙氨酸tRNA中含有11种化学修饰,包括 D、ψ、m5C、m7G、m1A、m22G、m2G、T、Y、Cm 和 Gm。其中 Cm 和 Gm 由于结构中缺少顺式二醇而无法被苯硼酸修饰的 MspA 纳米孔检测。通过传感酵母苯丙氨酸 tRNA 的消化产物,该团队成功绘制了酵母苯丙氨酸 tRNA 修饰图谱,鉴定出了剩余9种修饰的存在,其丰度与理论结果基本一致。
该方法无需对RNA消化产物预分离,可快速定量鉴定天然RNA中的已知和未知修饰,为发展边切边测的纳米孔表观遗传测序提供了重要的设计策略和研究方法。