文献赏析

华盈视角:外泌体全转录组——发现新型疾病标志物的摇篮

2020/08/14

美国食品和药品管理局(FDA)将2019年度Breakthrough Device Designation授予了Exosome Diagnostics公司的ExoDx Prostate (IntelliScore) (EPI)检测产品。EPI是通过检测尿液外泌体中ERG, PCA3和SPDEF基因的mRNA表达量实现对前列腺癌的提前诊断,诊断效能显著高于传统的诊断方1。由此可见,外泌体核酸标志物的研究及临床转化潜能,已经开始大放异彩。那么,怎样系统性开展一项外泌体RNAs标志物研究呢?今天华盈视角就通过复旦大学附属肿瘤医院黄胜林教授团队发表的两篇高质量的外泌体long RNAs诊断标志物文2,3,为大家揭开这个谜题。




 

案例一 血浆外泌体long RNAs

作为肝癌诊断的标志物

 

外泌体核酸包括诸多种类的long RNAs和以microRNA为代表的small RNAs。由于microRNA在外泌体丰富度和含量都比较4,限制了它的广泛性应用,而外泌体中含有更为丰富的long RNAs(包括mRNA, lncRNA, circRNA和Pseudogene),将long RNAs作为疾病标志物,相比microRNA可能更具优势。

黄胜林教授团队2019年发表于Clinical Chemistry杂志(IF= 7.292)上的研究成果,对159个健康者和104个肝细胞癌(HCC),9个胃癌(GC),12个结直肠癌(CRC),10个乳腺癌(BRCA),15个肾癌患者(KIRC)以及24个良性肝肿瘤,11个肝炎和8个肝硬化患者的血浆外泌体进行了系统的全转录组测序2。测序结果显示,血浆外泌体样本中普遍能够鉴定大约10000个以上有注释的基因,其中含量最多的是mRNA,占比达到了76%(图1a,b)。因此不难想象,筛选外泌体RNAs标志物时,mRNA成为候选标志物的比例会很高。同样,外泌体mRNA由于丰度高,其作为标志物也便于后续研究中利用PCR等技术进行验证,并进行临床转化,这也是诊断产品ExoDx Prostate (IntelliScore) (EPI)选择mRNA作为检测目标的原因之一。

另外和外周血单个核细胞PBMCs的RNA测序结果比较,结果发现能够覆盖mRNA全长的reads在外泌体中占比22.5%,在PBMCs中占比42.9%(图1c)这说明外泌体除了有相当数量完整的mRNA外,部分mRNA还会以片段化的形式存在于外泌体中。这也提醒研究人员在后续利用PCR等方法验证外泌体mRNA时,需要参考转录组测序的结果进行引物设计。除了mRNA外,外泌体中circRNA和lncRNA也占有一定比例(图1a,b)。对于circRNA而言,总共发现circRNAs的reads数是137196(图1d)。大约90%的circRNA与已知基因重叠,包括各种形式的circRNA(图1e)。并且和PBMCs相比,circRNA在外泌体中的有相对高的占比(图1f),这也说明了外泌体会富集大量的circRNA。总之,外泌体全转录组数据揭示了外泌体富含大量的long RNAs及片段。

图片 6.png

1. 血浆外泌体long RNAs组成

 

外周血中外泌体的母本细胞来源问题一直让大家很棘手,而外泌体全转录组有可能解决这个外泌体溯源的问题。因为不同组织细胞有各自特异的基因表达谱,外泌体携带母本细胞的基因,所以外泌体的基因表达谱也会反映出它的组织细胞来源。为此研究人员首先在含有30个人类组织的基因表达数据库GTEx中筛选出了1783个组织特异表达的基因,然后在健康者的血浆外泌体中进行检索,大约33.1%(591)的组织特异表达的基因出现在外泌体中(图2a),说明血浆外泌体富含组织特异性的基因。为了进一步验证,研究人员发现109个肝脏特异表达的基因中有73个在肝细胞癌患者血浆外泌体中的表达显著增加(图2a),说明在血浆外泌体含有的基因呼应了肝脏组织内的表达状态,由此可见从肝细胞癌患者血浆外泌体全转录组中筛选到标志物或许可以更加准确的反映出癌组织细胞的真实状态。反之,也可以根据外泌体全转录组数据反向溯源分析不同母本组织细胞的占比与丰度。研究人员通过比较分析正常人和肝细胞癌患者外泌体全转录组数据发现了22种不同的免疫细胞参与了外泌体的分泌,其中16种细胞的含量在肝细胞癌患者中显著增加(图2b),例如中性粒细胞,M2巨噬细胞(图2c)。现有的各种组织基因表达数据库联合外泌体全转录组极大方便了研究人员开展标志物组织溯源方面的数据挖掘和分析工作。游离的单个标志物容易受外周因素的影响,不能很准确的反应组织细胞的整体变化,基于外泌体全转录组学可以筛选出同时变化的多个基因作为标志物。同时,外泌体这种载体也对标志物分子起到了保护作用,保证了标志物变化的协调一致性,在疾病进展中更能准确反应组织整体变化,从而提高诊断的灵敏度和准确度。

图片 14.png

图2. 血浆外泌体全转录组数据溯源组织细胞来源
接下来,研究人员调查了外泌体long RNAs是否可以诊断肝细胞癌。研究人员将受试样本分为训练集(training),验证集(validation)和测试集(internal testing)(图3a),所有样本都开展血浆外泌体全转录组测序。在训练集阶段,研究人员将外泌体全转录组数据和TCGA中的肝细胞癌组织基因表达数据比对,结果发现了379个在癌症患者外泌体中上调的long RNAs也在肝细胞癌组织中上调。之后通过随机森林算法(RFA)和LASSO方法分析这379个上调的longRNA,确定了8个外泌体long RNA作为诊断肝细胞癌的标志物。然后利用随机变量机器学习算法(SVM)和ROC分析都验证了8个外泌体long RNAs联合诊断肝细胞癌的准确度非常高(图3b)。在诊断肝细胞癌患者和良性肝肿瘤患者的准确度上,8个外泌体long RNAs联合要显著高于传统的诊断标志物AFP(图3c)。这些结果说明血浆外泌体long RNAs可以作为癌症诊断的标志物。

 

图片 3.png

图3. 外泌体long RNAs标志物可准确诊断肝细胞癌

案例二 血浆外泌体long RNAs

作为PDAC诊断的标志物

同样的研究思路,黄胜林教授团队对胰腺导管腺瘤(PDAC)诊断进行了多中心的外泌体long RNAs标志物研究,相关成果2019年发表于Gut杂志(IF= 19.8193。该研究总共纳入了501个受试者,包括284个PDAC患者,100个慢性胰腺炎患者(CP),117个健康者(HC)。研究人员对所有受试样本开展血浆外泌体全转录组测序。测序结果鉴别了大约15000个有注释的基因。比较所有受试者发现PDAC,CP和HC之间血浆外泌体中检测到的long RNAs种类的数量基本一致(图4a)。使用t-SNE生成的三维数据散点图说明PDAC患者外泌体long RNAs图谱不同于健康个体和某些CP患者的图谱(图4b)。与CP和HC比较,鉴别了399个在PDAC中差异表达的外泌体long RNAs(图4c)。KEGG分析发现这些差异表达的外泌体long RNAs主要富集于癌症相关的通路,例如胰腺癌,mTOR和VEGF信号通路等(图4d)。这些结果说明外泌体long RNAs也可以作为诊断PDAC的潜在标志物。

 

图片 10.png

图4. 血浆外泌体long RNA测序

 

在训练集阶段(Training),研究人员整合比对血浆外泌体全转录组数据与组织基因表达数据库,机器学习分析筛选外泌体long RNAs标志物,随后开展多中心验证(Validation)(图5a)。在训练集阶段相对于CP和HC,PDAC患者血浆外泌体中有1502个long RNAs上调,随后研究人员比较了178个 PDAC癌组织RNA表达数据(TCGA)和171个正常胰腺组织RNA表达数据(GTEx),最后发现了有398个RNA在癌组织和PDAC血浆外泌体中都显著上调。研究人员通过随机森林算法和LASSO分析进一步确定了8个外泌体long RNAs可以作为诊断PDAC的候选标志物进行验证(图5b)

图片 2.png

图5. 筛选8个外泌体long RNA作为诊断PDAC的标志物

 

随后,研究人员在训练集,验证集的内部队列和外部队列利用ROC验证了8个外泌体long RNAs非常高精确度的诊断PDAC(图6a-c)。最后合并训练集和验证集进行分析,研究人员发现了外泌体long RNAs诊断标志物对早期的PDAC(I期和II期)具有很高的诊断准确度(图6d)。并且外泌体long RNAs诊断标志物联合CA199对于区分PDAC患者(CA199阳性)和CP患者的诊断准确度显著提高(图6e),并且外泌体long RNAs诊断标志物也可以高准确度的区分诊断CA199阴性PDAC患者和非癌症者(图6f)。这些结果说明血浆外泌体long RNAs可以作为PDAC诊断的标志物。

图片 18.png

图6. 外泌体long RNAs可准确诊断PDAC

 

通过上述两个精彩的案例,不难发现基于外泌体全转录组筛选到的标志物具有非常高精确度的诊断效能,外泌体全转录组可谓是新型疾病标志物发现的摇篮。但这是一项系统性的工作,对各技术环节都有较高的要求,例如外泌体分离、RNA纯化、微量建库、片段化RNAs数据比对与拼接、机器学习建模筛选差异候选标志物等等。很多研究人员看到这里,忽然感觉可遇而不可求。不用着急,华盈生物与国内外知名学者及研发企业合作,经过不断摸索和创新,建立了一整套的外泌体全转录组分析体系。我们能够稳定地从1mL血浆中分离出高质量的外泌体,并通过高通量测序方法获得 >10,000条long RNAs的数据。进一步,通过创新的测序数据比对算法进行高质量的片段化RNAs数据拼接,通过机器学习建模,为研究人员挑选出优秀的候选long RNAs标志物(图7)

图片 1.png

图7. 华盈生物外泌体全转录组标志物服务体系


在文章最后,小编特别呼吁一下,外泌体long RNA作为候选标志物大有可为,有临床问题和临床样本资源的研究人员可以抓紧时机,快速行动起来了。华盈生物也会持续努力,帮助研究人员扫除外泌体标志物研究路上的一个个技术拦路虎。

相关文献

 

1.       James McKiernan, Michael J Donovan, Vince O'Neill et al., A Novel Urine Exosome Gene Expression Assay to Predict High-grade Prostate Cancer at Initial Biopsy. [J]. JAMA Oncol. 2016;2(7):882-889. 

2.       Yuchen Li, Jingjing Zhao, Shulin Yu et al., Extracellular Vesicles Long RNA Sequencing Reveals Abundant mRNA, circRNA, and lncRNA in Human Blood as Potential Biomarkers for Cancer Diagnosis. [J]. Clin Chem.2019;65(6):798-808. 

3.       Shulin Yu, Yuchen Li, Zhuan Liao et al., Plasma extracellular vesicle long RNA profiling identifies a diagnostic signature for the detection of pancreatic ductal adenocarcinoma. [J]. Gut. 2020;69(3):540-550. 

4.       John R Chevillet, Qing Kang, Ingrid K Ruf et al., Quantitative and stoichiometric analysis of the microRNA content of exosomes. [J]. Proc Natl Acad Sci U S A. 2014 ;111(41):14888-14893.

相关阅读

 

1. 外泌体蛋白组如何帮助小样本量标志物研究发到高分杂志?

2. 华盈视角:外泌体蛋白质组分析如何助力肿瘤微环境研究

3. 外泌体蛋白质组学服务

4. 外泌体研究:临床医生申请国自然的小窍门

5. 国自然申请专题:外泌体研究经典技术路线(一)