蛋白质组学

蛋白注释利器Uniprot的玩法!

近日有粉丝向小编求生信科普文章,怎奈我们生信团队过于忙碌,无暇安排,小编为了满足粉丝要求也是无所不用其极,生信大师兄终于被我的良(ku)苦(kou)用(po)心而感动,加班赶制这篇Uniprot数据库的应用文章,快来一起学习吧!

http://www.qinglianbio.com/cdn.xypt.top/79e0f80b/21/03/a07915cc3e0d51ad8a5126bc230e7c8ba1022779.jpg

 

 

Uniprot(https://www.uniprot.org/)是信息最丰富、资源最广的蛋白质序列数据库,整合Swiss-Prot、TrEMBL 和 PIR 三大数据库的数据而成。怎样用uniprot对需要的蛋白进行注释呢?那我们就用uniprot数据库对一些微生物蛋白进行分型,找到这些蛋白对应的界门纲目科属种的注释信息。

 

首先,打开uniprot数据库的网站,找到ID mapping。

微信图片_20210308105145.png

进入IDmapping后,把需要注释的蛋白id导入Provide your identifiers里面。Select options选择默认选项就可以。导入蛋白完成后,点击Submit。

微信图片_20210308105150.png

 

其次,等网站注释完成后,会跳转到蛋白注释页面,里面有一些蛋白的基本注释结果,比如entry,entryname,genename,length等等注释。没有我们需要的分型注释。下面就需要我们把需要的注释信息调出来。点击columns;

微信图片_20210308105153.png

 

 

其中,红色标注的是刚才的注释信息,下面还有更多的信息和其他数据库的注释信息。

 

微信图片_20210308105157.png

 

比较重要的有蛋白,序列,长度,功能,表达,亚细胞,GO,标志物等等大量的注释信息。还有关联的string蛋白互作数据库,ensemble数据库等等常用数据库。

 

以及生物分类需要的Taxonomic lineage数据库,如图所示:

 

微信图片_20210308105201.png

 

点击选择界(Kingdom)、门(Phylum)、纲(Class)、目(Order)、科(Family)、属(Genus)、种(Species)。然后点击右上角的SAVE进行保存。

保存完毕后,网页会自动跳转到注释结果页面,里面就会显示刚才勾选的注释信息。

微信图片_20210308105204.png

 

这些蛋白的所在的生物分类就可以一目了然了。

当然,如果还想需要其他的注释信息,可以根据自己的需求,勾选需要的,去掉不需要的。最后,得到了需要的注释信息,我们可以把注释信息下载下来,下面推荐excel格式的。

微信图片_20210308105207.png

 

 

下载到本地后的数据格式为:

微信图片_20210308105210.png

 

 

 

总结

uniprot对蛋白的注释不仅全面,还很方便,只需要知道蛋白id,只需要按照上面的教程,得到大量的注释信息。例如,得到蛋白的生物分类,再加上蛋白在样本里面的定量信息,在进行进一步的生信分析,就能得到各种好看有用的图片。

 

 

示例图展示

Krona分型图

微信图片_20210308105232.png

 

菌群热图

微信图片_20210308105237.png

 

菌群堆积柱状图

微信图片_20210308105241.png

 

亲们,生信大师兄的分享就到这里喽,如果您想了解其他关于生信的知识,请识别下方二维码关注我们,留言给小编,给您安排的妥妥的哦!

 

(0)

热评文章

发表评论