蛋白质研究课题又难又累,但是具有重要的意义,今天分享几个蛋白质数据库给大家😁
1.Uniprot
https://www.uniprot.org

Uniprot是 Universal Protein 的英文缩写,是信息最丰富、资源最广的蛋白质数据库。它由整合Swiss-Prot、 TrEMBL 和 PIR-PSD 三大数据库的数据而成。他的数据主要来自于基因组测序项目完成后,后续获得的蛋白质序列。它包含了大量来自文献的蛋白质的生物功能的信息。
UniProtKB/Swiss-Prot
高质量的、手工注释的、非冗余的数据集;主要来自文献中的研究成果和E-value校验过计算分析结果。有质量保证的数据才被加入该数据库。
UniProtKB/TrEMBL
该数据集包含高质量的计算分析结果,一般都在自动注释中富集,主要应对基因组项目获得的大量数据流以人工校验在时间上和人力上的不足。他能注释所有可用的蛋白序列。在三大核酸数据库(EMBL-Bank/GenBank/DDBJ)中注释的编码序列都被自动翻译并加入该数据库中。它也有来自PDB数据库的序列,以及Ensembl、Refeq和CCDS基因预测的序列。
UniParc
UniParc全称是UniProt Archive,他是一个综合性的非冗余数据库,他包含了所有主要的、公开的数据库的蛋白质序列。 由于蛋白质可能在不同的数据库中存在,并且可能在同一个数据库中有多个版本,为了去冗余,UniaraParc对每条唯一的序列只存一次。无论是否为同一物种的序列,只要序列相同就被合并为一条,每条序列提供稳定的、唯一的编号UPI。该数据库只含有蛋白质的序列信息,而没有注释数据。

The Human Protein Atlas(人类蛋白质图谱数据库)基于蛋白组学、转录组学以及系统生物学数据,可以绘制蛋白质图谱的数据库。免费提供人类编码蛋白信息的公共数据库。其结果用高分辨率免疫组化染色图显示,并且由组织学专业人员进行注释。
3.InterPro
https://www.ebi.ac.uk/interpro

集成的蛋白质结构域和功能位点数据库,包含关于蛋白质家族、域、重复序列、和作用位点等数据资源,来自不同数据库的诊断签名的人工注释文件,形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。可提供蛋白序列的功能分析并归纳为一个个蛋白家族。
4.PDB

蛋白质结构的精确坐标数据(三维结构)。这种数据即蛋白质中的原子坐标,是蛋白质结构的最细致的层次。为了确保PDB资料的完备与权威,各个主要的科学杂志、基金组织会要求科学家将自己的研究成果提交给PDB。
5.Binding DB
https://www.bindingdb.org/bind/index.jsp

里面含有药物靶点蛋白质和类药小分子之间相互作用亲和力,即非共价结合数据。PDB 相关文献报道数据、专利信息、PubChem BioAssays 数据和ChEMBL 记录数据。可用于药物研发和结合预测模型的构建。