蛋白质组学

KEGG通路注释及富集分析

KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是系统分析基因产物在细胞中的代谢途径以及这些基因产物功能的数据库。KEGG该数据库有助于把基因及表达信息作为一个整体的网络进行研究。KEGG整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(PATHWAY)、药物(DRUG)、疾病(DISEASE)、基因序列(GENES)及基因组(GENOME)等。

 

  通路注释统计

  在生物体内,不同的基因产物相互协调来行使生物学功能,对差异表达基因的通路(Pathway)注释分析有助于进一步解读基因的功能。

 

 

蛋白质

 

KEGG注释结果通路图

 

 

  通路分类

  对差异表达基因KEGG的注释结果按照KEGG中通路类型进行分类,如下图所示。纵坐标为KEGG代谢通路的名称,横坐标为注释到该通路下的蛋白个数及其个数占被注释上的蛋白总数的比例。

 

 

蛋白质

 

差异表达蛋白的KEGG分类图

 

  通路富集分析

  分析差异表达蛋白在某一通路上是否过出现(over-presentation)即为差异表达蛋白的通路富集分析。我们采用Kobas软件进行差异表达蛋白的KEGG通路富集分析。图中每一个点表示一个KEGG通路,通路名称见左侧坐标轴。横坐标为富集因子(Enrichment Factor),表示差异表达蛋白中注释到该通路的蛋白比例与该物种蛋白注释到某通路的蛋白比例的比值。富集因子越大,表示差异蛋白在该通路中的富集显着性越可靠。

 

 

蛋白质

 

差异表达蛋白KEGG通路富集统计图

 

 

 

 

 

(1)

热评文章

发表评论