文献赏析

高分文章策略一: 动物模型在蛋白标志物研究中的妙用

2020/11/16

 

标志物研究只能仅限于临床样本吗?
利用临床样本开展标志物研究会受到诸多因素的制约,从而较难确定标志物与疾病的直接相关性。同时,受到人群个体差异的影响,临床标志物研究需要大量样本产生的数据作为支撑,才具有统计说服力。相比之下,动物模型实验可人为控制外界影响因素(年龄和肿瘤类型和分级等),动物模型遗传背景相似,个体差异也更少1。虽然动物实验的结果还需要回归到临床上进行验证,但通过动物模型找到的标志物可能和疾病的相关性更加确定。特别是在临床样本收集困难,经费不富余的情况下,结合动物模型或许可以找到更具价值的标志物。另外,在筛选完标志物后,动物模型还可直接应用到下一阶段的机制研究中,有效保持科学研究的连续性。今天华盈视角为大家分享两篇利用动物模型筛选疾病标志物的研究设计,一起领略动物模型在蛋白标志物研究中的妙用。


 

 

案例一 利用小鼠模型筛选诊断前列腺癌的血清标志物

临床上应用的很多蛋白标志物都是糖基修饰的蛋白,所以研究者聚焦在筛选血清糖基化蛋白作为前列腺癌的诊断标志物。研究者开展了2个阶段的筛选和验证研究。起始的筛选阶段,研究者首先通过糖肽固相萃取和酰肼树脂方法分别富集小鼠组织和血清中的N-linked糖蛋白,之后通过label free LC-MS/MS进行分析,筛选潜在的血清标志物;验证阶段,研究者通过靶向蛋白组学SRM-MS和ELISA在前列腺癌患者血清中检测潜在标志物的表达,通过随机森林算法筛选构建诊断模型(图1)。相关研究在2011年发表于国际著名学术期刊Proc Natl Acad Sci杂志1

图片 7.png

图1. 标志物研究方案

第一阶段,小鼠模型实验:研究者通过LTQ-FT软件对质谱结果分析,鉴定了小鼠前列腺组织和血清中总共775个糖蛋白,其中658个蛋白表达在前列腺组织中(图2A),只有95个蛋白在组织和血清中都可以被鉴别出(图2A)。对比正常小鼠,总共分别有152个蛋白和21个蛋白惟一地表达在前列腺癌小鼠组织和血清中(图2A)。之后研究者利用SuperHirn软件分别对247个组织蛋白和139个血清蛋白,总共352个蛋白(其中34个组织和血清共有)进行定量分析。和正常小鼠相比,组织中有68个差异表达的蛋白,血清中有12个差异蛋白(图2B),接着研究者对高显著性的几个蛋白进行了western blotting和免疫荧光验证分析(图2C,D)。最后研究者根据3个原则(前列腺组织特异表达的蛋白、具有显著性差异的蛋白、在血清中可以检测到的)从小鼠的这些数据中选取诊断前列腺癌患者的候选标志物。值得注意的是作者在这里并没有完全仅仅按照显著性和差异倍数来选取标志物,或许是考虑到物种间的差异性。作者最终选取了126个蛋白作为潜在的标志物,包括30个前列腺组织特异性表达的蛋白,其中的11个组织特异性蛋白的表达在癌症和正常小鼠中并无差异;总共47个蛋白在小鼠血清中也可以被检测到;12个蛋白唯一性的表达在癌症小鼠中,这其中有9个蛋白是在血清中唯一性检出的蛋白。

图片 9.png

图2. 分析小鼠前列腺组织和血清糖蛋白组

第二个阶段,临床验证实验:研究者首先检测是否前列腺癌患者中PTEN失活也与上述的血清标志物相关。研究者收集了77个前列腺癌患者和66个良性前列腺增生患者的血清样本,同时对其中的59个前列腺癌和40个良性前列腺增生患者进行了组织芯片分析(图3A)。研究者利用酰肼树脂方法富集了这些血清样本中的糖蛋白,根据作者自己优先考虑的某些原则,利用SRM-MS定量检测了第一阶段发现的126个差异蛋白中的49个蛋白,共57个N-glycosites肽段。定量结果显示在80-105个病人中,始终可以检测到33个蛋白的37个多肽。作者还利用ELISA验证了6个蛋白,补充了SRM的检测结果,最终总共定量分析了39个蛋白,以作为潜在标志物。为了建立最优的预测模型来区分PTEN正常和失活状态,研究者利用随机森林算法对这39个蛋白进行了筛选分析。作者选择了排名最高的20个预测模型,并且对1-5个血清蛋白的组合形式进行logistic回归分析预测PTEN失活状态。通过ROC分析,发现THBS1、TIMP-1、CFH、LRP-1这4个蛋白组成的诊断模型可以准确预测PTEN的失活状态(PTEN正常,n=26; PTEN失活,n=28)(图3B)。而GALNTL4、FN、AZGP1、BGN、ECM1这5个蛋白组成的诊断模型可以准确预测肿瘤病人的不同分期(Gleason score <7 or ≥7)(图3C)。最后,研究者还发现HYOU1、ASPN、CTSD、OLFM4这4个蛋白组成诊断模型,可以准确的预测前列腺癌,区分前列腺增生。将这4个蛋白与传统标志物PSA结合,能够大幅度提高PSA的诊断效能(图3D)。综上,研究通过临床样本的验证,明确了小鼠模型中筛选到的蛋白标志物确实可以成为临床诊断候选标志物。

图片 10.png

图3. SRM-MS和ELISA验证前列腺癌血清诊断标志物。

A,Venn图展示纳入的病人,可用的血清和组织。B,诊断PTEN失活和正常的前列腺癌。

C,诊断不同肿瘤分级的前列腺癌患者。D,诊断前列腺癌患者和良性前列腺增生患者。

 

案例二 整合小鼠脑组织蛋白组和转录组筛选缺血性脑中风标志物

本研究的目的是为了寻找缺血性脑中风潜在的标志物。研究者通过大脑中动脉闭塞构建了小鼠缺血性脑中风模型,继而对中风小鼠缺血的脑半球(ipsilateral, IP)和非缺血的脑半球(contralateral, CL)开展了label free蛋白组学以及转录组学的研究。研究者对筛选出的差异基因和蛋白分别通过数字PCR靶向蛋白组学PRM在小鼠模型中进行验证和评估潜在的标志物,最后利用ELISA检测证实,这些潜在的标志物也存在于中风小鼠模型和中风患者的血浆中(图4)。此项研究于2020年发表于蛋白组学权威期刊Mol Cell Proteomics2.

图片 1.png

图4. 研究思路

在discovery阶段,研究者通过label free LC-MS/MS结合表达谱基因芯片对脑缺血小鼠模型缺血和非缺血的脑半球组织样本,以及假手术组(执行手术,但不闭塞大脑中动脉)小鼠两个脑半球均进行了蛋白表达谱和mRNA表达谱对比分析。发现缺血和非缺血脑组织共有76个差异基因和192个差异蛋白(p-values<0.05)差异变化(图5A)。特别注意的是差异基因和蛋白之间并没有重叠性,这种不一致性说明mRNA和蛋白的变化并不在同一调控维度上,也说明将mRNA与蛋白分开检测具有充分的必要性。另外,分析假手术组小鼠的两个脑半球组织,研究者只鉴别了2个差异基因和60个差异蛋白。这说明缺血处理相对于手术操作,大脑中动脉供血闭塞是导致小鼠脑组织的基因和蛋白表达变化的主要因素。通过多重协惯量分析(Multiple Co-Inertia Analysis,MCIA)发现这些差异基因和蛋白可以将缺血和非缺血两种表型分开(图5B)。

图片 11.png

图5. 分析缺血性和非缺血性脑组织间的差异基因和蛋白。
A. 差异基因和蛋白间没有重叠性。B. 缺血和非缺血组织很明显的可以分开。
黑色代表非缺血;灰色代表缺血;原点代表基因;箭头代表蛋白。

在qualification验证阶段,研究者通过Nanostring®nCounter分析和PRM-MS、Western blotting等技术分析了候选的12个基因和5个蛋白标志物在另外一组独立小鼠模型脑组织中的表达差异。在这组小鼠中,研究者将缺血模型分为了早期(2h)和晚期(6h)两个阶段。研究者发现了Ccl3, Atf3, Fosb, Gadd45g, Rgs2,4933427D14Rik, Cldn20, Cstad这8个基因和BAG5, CTNND2这2个蛋白的差异性表达和discovery阶段一样(图6),研究者对比了它们在缺血早期和晚期之间的表达,发现了Gadd45g, Rgs2,Cldn20基因和BAG5, CTNND2蛋白在缺血早期和晚期间也具有差异性表达(图6),继而研究者通过ELISA检测了这5个待选标志物在中风小鼠和临床中风患者血浆中的表达状况。对比发现RGS2、GADD45G和CTNND2的表达在缺血后都出现了显著性的改变(图7A)。研究者对比了这些候选标志物在假手术小鼠中左右脑半球的表达,发现它们并没有差异,更加确定了它们的表达变化只与脑缺血直接相关

图片 3.png

图6. Nanostring和PRM-MS验证候选标志物的表达

研究者接着利用ELISA检测了临床上中风患者和中风状况类似患者血浆中RGS2、GADD45G和CTNND2蛋白的表达。对比分析发现RGS2的表达并没有差异,GADD45G的表达和小鼠模型一致,在中风患者血浆中表达升高(图7B),但是CTNND2在中风患者血浆中的表达也增加(图7C),CTNND2的表达趋势和小鼠模型中的表达相反,这也说明物种之间存在的差异性。研究者将临床数据与GADD45G和CTNND2蛋白的表达结合起来,显著提高了对临床缺血性中风患者的诊断效能(图7B,C)。

图片 4 (2).png

图7. ELISA检测待选标志物在小鼠和患者血浆中的表达。

由于该研究的组学筛选阶段是在小鼠模型上进行,非常方便地获取了病原灶部位的脑组织mRNA和蛋白表达谱数据。因此,对差异基因和蛋白进行联合分析还可能发现缺血性脑中风疾病发生和进展的潜在分子机制研究者通过网络相关结构分析(rCCA)发现了这些差异基因和蛋白具有高度的相关性。CAMK2A 和SRGAP2两个分子作为网络的核心,分别联系了19个和10个分子(图8A)。GO分析也表明了这些相关的分子与神经发育,突触和缺氧途径相关,而这些通路都已经证明了与脑缺血紧密关联(图8B)。除此之外,差异分子还与MAPK通路,AP-1转录,G蛋白受体和免疫系统的功能相关,说明这些分子和相关的通路在缺血性中风的病理发生中发挥着重要作用,为进一步的机制研究指明了方向。

图片 12.png

图8.分析差异基因和蛋白关系,以及功能分析。
A. 差异基因和蛋白间具有高度网络相关性。椭圆代表基因;长方形代表蛋白。
上述两个精彩的案例展示了动物模型怎样应用在疾病标志物的研究中。同时两个研究用了非常相似的策略和技术手段进行研究,都是通过label free蛋白组学方法筛选标志物,PRM-MS, SRM-MS或者MRM-MS靶向蛋白组学技术进行标志物验证。这两种类型的蛋白组学技术的联合应用也是标志物研究的经典路线。

82c6a535291919d1df5d21fd683abc7.png

华盈生物致力于蛋白质谱技术的应用的研究,可以提供一系列的蛋白质组学技术服务,包括非标记定量标记定量以及靶向蛋白组学技术,同时华盈生物还提供后续数据的深度分析包括支持向量机,逻辑回归,随机森林算法等机器学习模型构建,为大家在科研道路上保驾护航。

相关文献

1. Cima I, Schiess R, Wild Pet al., Cancer genetics-guided discovery of serum biomarker signatures for diagnosis and prognosis of prostate cancer. Proc Natl Acad Sci U S A. 2011;108(8):3342-3347. 

2. Simats A, Ramiro L, García-Berrocoso T, et al., A mouse brain-based multi-omics integrative approach reveals potential blood biomarkers for ischemic stroke. Mol Cell Proteomics. 2020;mcp.RA120.002283.

相关阅读

1. 华盈视角:外泌体蛋白质组分析如何助力肿瘤微环境研究

2.蛋白质组学技术应用于中药靶点的寻找

3.外泌体蛋白组如何帮助小样本量 标志物研究发到高分杂志?