蛋白质组学

GO功能注释及富集分析

Gene Ontology(简称GO)是一个国际标准化的基因功能分类体系,提供了一套动态更新的标准词汇表(Controlled Vocabulary)来全面描述生物体中基因和基因产物的属性。GO总共有三个本体(Ontology),分别描述基因的分子功能(Molecular Function)、所处的细胞位置(Cellular Component)、参与的生物过程(Biological Process)。

  GO数据库中一个基本的概念是节点,每个节点都有一个名称,比如“Cell”、“Fibroblast Growth Factor Receptor Binding”或者“Signal Transduction”,同时有一个唯一的编号,如“GO:nnnnnnn”。基于鉴定到的蛋白ID,采用mapping的方式从Uniprot数据库中得到蛋白质的GO数据库注释信息,对蛋白质进行功能分类注释。针对BP,CC和MF中所涉及的GO节点,列出所有相应蛋白质个数,同时分别对表达蛋白的二级分类情况做出统计图。

 

  二级分类统计图

  展示的是在差异表达上调蛋白和下调蛋白GO各二级功能的蛋白富集情况,体现两个调节方向下各二级功能的地位,具有明显比例差异的二级功能说明差异表达上调蛋白与下调蛋白的富集趋势不同,可以重点分析此功能是否与差异相关。

 

蛋白质

 

差异表达蛋白的GO二级注释

 

 

  GO分类图

  GO分类图显示了三个本体中所涉及到各条目的分布情况,不同颜色标记为三个本体中涉及到的各个条目。饼状图代表条目数量占总蛋白数量的百分比。

 

 

蛋白质

GO分类图

 

 

  蛋白质富集分析

  通过对差异表达蛋白进行富集分析,可以得到差异表达蛋白在GO节点中的富集显着性。并对显着富集的节点在GO体系中的层级关系以有向无环图的形式进行直观展示。topGO有向无环图能直观展示差异表达基因富集的GO节点(Term)及其层级关系,是差异表达基因GO富集分析的结果图形化展示,分支代表包含关系,从上至下所定义的功能描述范围越来越具体。在有向无环图中,箭头代表包含关系,即该节点的所有基因同样注释到其上级节点中。

 

 

蛋白质

 

 

差异表达蛋白topGO富集有向无环图

 

 

 

 

(1)

热评文章

发表评论