蛋白质组学

WGCNA助力迄今为止大规模的阿尔兹海默病症蛋白质组学研究

近日,国际杂志Nature medicine发表了题为“Large-scaleproteomic analysis of Alzheimer s disease brain and cerebrospinal fluid revealsearly changes in energy metabolism associated with microglia and astrocyteactivation”的研究结果,对453例阿尔兹海默症的临床脑组织和脑脊液样本进行了Labelfree定量蛋白质组学分析,这是目前世界范围内规模的阿尔兹海默症蛋白组学研究。该研究通过WGCNA算法生成13个蛋白质共表达网络模块,发现M4星形胶质细胞/小胶质细胞代谢模块与AD的相关性最强,指出了胶质细胞/小胶质细胞在AD进展过程中的指标变化,为AD的药物治疗和标志物都指明了潜在方向。一起来看看吧~

mmexport1606980900015.jpg

多组学联合分析

 

多组学联合分析阿尔兹海默症脑组织和脑脊髓液的大规模蛋白质组学分析揭示了与小胶质细胞和星形胶质细胞激活相关的能量代谢的早期变化

mmexport1606980904408.jpg

蛋白质组学研究示意图

 

对质谱定量到的5668个蛋白进行归一化,剔除缺失值,最终使用WGCNA算法对其中3334个蛋白质进行分析,生成13个蛋白质共表达网络模块,每个模块内的蛋白都具有相似的表达模式。

mmexport1606980909496.jpg

多组学联合分析蛋白质共表达模块

 

 

通过将模块特征性蛋白与AD淀粉样β斑块和神经原纤维缠结的神经病理学特征相关联来评估共表达模块与AD的相关性,发现M4星形胶质细胞/小胶质细胞代谢模块具有最强的AD相关性。随后通过TMT和PRM定量蛋白质组学对这一结果进行了验证。

更深入地研究M4模块的细胞类型性质,发现M4模块富含AD遗传危险因素,其中的小胶质细胞类型标记似乎偏向于保护性抗炎,而不是有害的促炎性小胶质细胞表型。

为了探讨来自M4模块的蛋白质是否也可以用作AD液体生物标志物,分析了来自两个不同队列的脑脊液(CSF),发现许多的蛋白质在AsymAD和AD中都升高,包括M4集线器蛋白质CD44,PRDX1和DDAH2。表明脑脊髓液中的M4星形胶质细胞/小胶质细胞代谢蛋白增加。

mmexport1606980914303.jpg

mmexport1606980916750.jpg

M4星形胶质细胞/小胶质细胞代谢模块富含AD遗传危险因素和抗炎性疾病相关小胶质细胞的标志物

 

 

 

 

 

总结

研究者对脑组织和脑脊液进行了大规模定量蛋白质组学分析,报道了AD与其他疾病的潜在的网络关联图,并突出了胶质细胞/小胶质细胞在AD进展过程中的指标变化,为AD的药物治疗和标志物都指明了潜在方向。

 

 

在本文的数据分析中起到关键作用的

WGCNA加权分析,

到底是做什么的?

 

加权基因共表达网络分析(WGCNA, Weighted correlation networkanalysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治疗靶点。

相比于只关注差异表达的基因,WGCNA利用数千或近万个变化的基因或全部基因的信息识别感兴趣的基因集,并与表型进行显著性关联分析。一是充分利用了信息,二是把数千个基因与表型的关联转换为数个基因集与表型的关联,免去了多重假设检验校正的问题。

 

本文WGCNA算法:使用3334个蛋白的log2丰度值×419个样本矩阵,并进行协变量和批次校正。WGCNA::blockwiseModule()函数参数设置:软阈值功率β=5.5,deepSplit=4,最小模块大小为14,合并切割高度为0.07,平均TOM,最小kME为0.30,重新分配阈值P 0.05。简而言之,即计算每个蛋白对权重中位数的相关性(bicor, a robust correlation metric),并将此相关矩阵转换为邻接矩阵。使用该矩阵内各部分的连接强度来计算拓扑重叠矩阵,该矩阵表示跨队列样本的蛋白表达模式相似性的测量结果,该队列样本是基于网络中所有蛋白质的成对相关性而构建的。通过这种方法使用1-TOM进行层次蛋白质相关性聚类分析,并使用WGCNA::blockwiseModules()函数中实现的动态树切割来建立初始模块。定义的模块特征蛋白,其代表该模块最有代表性的丰度值,并解释该模块蛋白的协方差。

mmexport1606980919327.jpg

 

各蛋白质和各个模块特征蛋白之间的皮尔森相关性分析:将各模块成员相关性测量值定义为kME。在最初的网络构建之后,检测到18个包含14种或更多蛋白质的模块。鉴于某些模块之间的kME高度相似,使用WGCNA::moduleMergeUsingKME()函数将模块的数量合并减少到13,合并参数为:kME重叠的模块成员的百分比为50%(threshPercent=50),阈值合并具有较高kME,intramodule 25%(mergePercent=25)的模块,其他参数均为默认值。模块合并后,分别使用WGCNA::moduleEigengenes()和WGCNA::signedKME()函数重新计算模块特征蛋白(ME)和标志性的kME值。最后,通过以下算法来清理异常kME值:去除kME.intramodule 0.28的模块成员,然后检查kME 0.35的所有未聚类的蛋白,并分配给kME.intramodule的模块。

 

 

 

本文详细相应数据和R代码可至如下链接查看:

https://github.com/edammer/TAMPOR

WGCNA基础版可参考如下链接:

https://www.jianshu.com/p/f80de3468c04

https://www.jianshu.com/p/25905a905086

http://www.360doc.com/content/19/0928/18/62751463_863740918.shtml

 

 

提供一站式蛋白质组学,代谢组学,多组学联合分析等科研服务,更有超强的生信团队为您提供个性化分析服务。专业的技术团队,强大的检测平台,助您在科研道路上披荆斩棘,冲击高水平文章。关于更多组学的技术细节,敬请来电咨询。

 

 

 

 

(0)

关键词:

热评文章

发表评论