蛋白质组学

最懂你的实验设计来喽!

由于蛋白质组学实验非常复杂,因此很容易失败,并且没有明确的原因。使用标准的实验设计技术并结合质量控制可以大大增加成功的机会。2017年,Methods in Molecular Biology期刊上在线发表了题为“Designing Successful Proteomics Experiments”的方法型研究论文。该文重点介绍了相关概念,并提供蛋白质组学工作流程的示例。将这些概念成功应用于蛋白质组学实验是很简单的。它可以帮助确定实验失败原因,并且大大增加实验的可重复性。

 

微信图片_20210308112055.png

 

蛋白质组学旨在对复杂的生物学背景(例如组织和血浆)中的数千种蛋白质进行定量。通常在多个制备步骤(包括蛋白质提取、富集、分离和消化)之后,使用诸如质谱仪之类的灵敏仪器完成此操作。由于这些复杂的实验室过程在整个研究过程中可能缺乏稳定性,因此,除非实验旨在考虑这一点,否则它们会对结果产生负面影响。最近美国国立卫生研究院强调了实验的可重复性,指出将对拨款申请进行专门审查,以“为获得稳健和公正的结果而进行的严格实验设计”为标准。因此,实验设计不仅在执行研究中很重要,而且对于实验经费的申请中也很重要。

 

蛋白质组学研究的7个关键步骤:

 

1.定义研究目标和相关的响应变量

首先要明确研究目标,包含以下问题:“您想要解决什么问题?”和“您将比较哪个样本组?”明确这些响应变量。然后确定实验方法,例如MRM(多反应监测)、DDA(数据依赖性采集),DIA(数据非依赖性采集)或其他方法之间进行决策。预估效应大小非常重要,因为这将有助于确定需要分析多少个样本。对于早期生物标志物筛选,无论大小如何,任何显着差异都可能令人感兴趣。而在其他情况下,例如毒理学研究,只有生理上有意义的差异才有价值。

微信图片_20210308112100.png

图1. 设计高效蛋白质组学实验的主要步骤

 

2.列出相关因素

这些因素是指那些可能影响响应变量的事物。理想情况下,响应仅受实验系统设计要测量的物理性能的影响。但是在实际操作中还会受到一些其他因素的干扰。例如,测得的肽段峰面积不仅取决于该肽的丰度,还取决于电喷雾的稳定性,色谱柱残留量和蛋白水解的效率。消化效率可能反过来取决于胰蛋白酶试剂批号以及由哪个实验室技术进行消化等。我们在实验研究中更改的那些因素称为实验因素。例如,当比较亚细胞级分之间的蛋白质组时,蛋白质组级分(例如,细胞质或细胞核)就是这种因素。如果我们要测试色谱对峰高的影响,则流速可能是实验因素。识别有害因素的目的是使它们对响应变量的影响最小化。

 

 

3.设定质量控制程序

 

设定质控样本,质控样本的目的是指出流程或设备何时发生故障,或者更好地向我们保证它们没有发生故障。对质控样品的测量应定量指示过程和设备的性能。可以将多个样品用于QC不同的实验步骤。例如,可以使用细胞裂解液或其他复杂混合物定期评估蛋白质分馏工作流程,并通过分馏物中的紫外线吸收给出定量数据。可以使用简单的肽段混合物测量LC-MS的性能,对肽和电荷状态之间的峰面积以及反映污染或残留的其他峰进行定量。或者,可以在整个工作流程中定期运行从目标生物样品中提取的QC样品。

 

 

4.优化工艺

 

供应商提供的Protocols为实验的关键部分提供了详细的路线图。但是,要使实验系统整体正常运行,还需要调整许多参数。例如,安捷伦的喷射流电喷雾电离源具有六种调节功能,例如干燥气体温度、雾化器电压和毛细管电压等。

 

 

5.评估所需的样本数

 

如果研究的样本数量不足(缺乏足够的独立样本或技术重复)则难以以高概率的情况来解释研究的问题,这样可能会导致错误的肯定结论或错误的否定结论。要创建可能会得到我们想要的效果的研究,我们必须评估需要多少样本并相应地设计实验。通过中试实验测量噪声水平(影响变量的一些因素)是设计中的关键步骤。建议从同一组(例如疾病,对照)中至少采集十个独立的生物学样本,以评估其差异性。这包括来自技术实验方面的噪声以及来自重复样本之间生物学差异的噪声。另外,应对同一种生物样品进行处理和测量至少五次,以评估技术差异程度。尽管这些实验似乎是一笔昂贵的投资,但它们提供的知识对于首次进行成功的实验至关重要。

 

 

6.配置实验

 

现代实验设计可以追溯到R.A. Fisher于1926年首次发表的著作,他确定了实验设计的三个基石:blocking、随机化和复制(blocking、randomization和replication)。blocking和随机化可消除有偏见的答案,复制可以提高信噪比,从而提高实验结果的准确性。

 

a.Blocking

在实验过程中,许多因素会对实验造成影响。例如试剂批次、操作人员、上机时间等。其中一个因素的变化,都可能会对实验结果产生影响。假如按这样一个因素的水平将两个样本组分开(例如,所有实验组的样本都在一天之内上机检测,而所有对照组的样本则在另一天上机检测),那么这些技术变化可能会被误认为是生物学效应。其解决方案是使用blocking。对于一些变量因素会进行一个小的平衡实验。例如,如果每天只能运行八个样本,那么每天将运行两个样本组中的每个样本组中的四个。响应变量的任何变化都将几乎平等地影响两组,从而避免可能导致的错误发现。当存在多个这样的因素时,以平衡的方式解决设计可能是一项挑战,特别是如果这些因素之间存在相互作用。当无法进行平衡设计时应使用随机化。

 

b.随机化

可能存在多种干扰因素,在这些干扰因素上不清楚如何平衡时,例如在设备或操作人员注意力变化的情况下,一天样品的处理顺序可以随机化。蛋白质组学中的时间随机化尤为重要,因为存在许多潜在的不稳定因素,包括LC色谱柱退化、电喷雾不稳定性、传输管堆积等。随机化具有抵消因无法预知的影响而产生的误差的额外优势。

微信图片_20210308112103.png

图2.蛋白质组学LC-MS工作流程的随机化设计

 

c.复制

与试图消除可能被误认为或掩盖实际效果的系统偏差的blocking和随机化不同,复制的目的是减少随机测量变量的影响。这样可以更地阐述研究的问题。复制有两种类型。通过重复地从群组中抽取独立的随机样本,我们可以获得对该群组的平均应答值(例如蛋白质表达水平)的越来越准确的估算,这是生物复制。此外,任何研究样品都可以在实验室中进行多次处理,并对结果取平均值以减少处理过程差异的影响,这是技术复制。

 

7.数据分析

分析步骤包括蛋白质鉴定、定量和统计分析。最常见的方法是t检验和ANOVA。对于blocking设计,必须确保在分析中考虑到blocking(以便在估算噪声水平时忽略这些变量之间可能存在的巨大差异)。通常可以使用方差分析(ANOVA )或混合效应模型(mixed effects models)中的blocking因子来实现。一般情况下,统计分析必须与研究问题和实验设计相匹配。另外,对照样品也必须进行分析。这些QC可以用于检测不同因素之间(例如,跨天)的性能变化,以表征设备性能的变化。对阳性和阴性对照样品的分析可以验证整个实验工作流程是否正常运行。

 

 

结 论

Oberg和Vitek指出:“如果不对实验设计给予适当的关注,所有定量研究均无法提供可再现且准确的结果”。设计良好的实验不会比设计不良的实验花费更多的精力。然而,对于实验的成功或了解实验失败的原因至关重要。R. A. Fisher确定的实验设计中三个重要的基石是blocking、随机化和复制。此外,通过建立适当的质量控制,可以有助于消除因一些系统因素而造成的实验误差。最后,鼓励通过公共存储库(例如proteomexchange.org)共享蛋白质组学数据。它不仅减少了不必要的重复研究,而且使比较相似的数据集可以评估质量和准确性。尽管目前尚不存在用于LC-MS质量控制运行的标准,但将这些信息共享在一起的实验数据有一天可以大大简化调试和优化蛋白质组学实验的过程。

 

拥有完善的质控体系,避免因一些系统误差对实验结果造成的影响。可提供一站式蛋白质组学、代谢组学、转录组学、多组学联合分析等科研服务。在质谱检测方面项目经验丰富,拥有国际一流的质谱平台,海归坐镇专业生信分析团队,助您在科研道路上乘风破浪,冲击高水平文章。更多技术服务敬请来电咨询:010-53395839。

 

 

设计成功的蛋白质组学实验

期刊名称:Methods in Molecular Biology

 

 

微信图片_20210308112109.jpg

(0)

热评文章

发表评论