展开全部 +
首页 . 理学 . 生物学 . 生物工程 . 蛋白质工程 . 蛋白质工程 . 蛋白质功能分析 . 生物信息学分析 . 生物信息学数据库 . 蛋白质数据库

蛋白质数据库

/protein data bank; PDB/
条目作者华子春

华子春

最后更新 2023-07-29
浏览 220
最后更新 2023-07-29
浏览 220
0 意见反馈 条目引用

生物医学领域第一个开放存取的数字数据资源。

英文名称
protein data bank; PDB
所属学科
生物学

全球领先的以科学发现为核心的实验数据资源。通过互联网信息门户和可下载的数据档案,PDB提供对大生物分子(蛋白质、DNA和RNA)的三维(3D)结构数据的访问,包括存在于地球上所有的生命有机体的分子。

于1971年创建于美国布鲁克海文国家实验室(Brookhaven National La-boratories; BNL),最初是用作生物大分子晶体结构的档案库。开始时,该档案库只有7个分子结构的数据,以后的几年中每年新增也很少。到20世纪80年代,随着结晶方法学、核磁共振技术的提高以及对数据共享共识的达成,每年存储的信息量显著增加。同时,随着结构基因组的启动和这些数据在生物研究中价值的逐步体现,对数据的收集途径、组织分类等方面提出了新的要求。1998年10月,PDB改由结构生物信息学研究合作组织(Research Collaboratory for Structure Bioinformatics; RCSB)负责管理,RCSB建立了这个基于先进的信息技术的数据库,从而有利于结构数据的应用和分析,成为生物学研究的有力资源。PDB建立之初,仅有结构研究的少数专家使用,如今这些数据在生物学、化学、计算机等领域的科研及教学中得到广泛应用。

蛋白质的结构主要分为四级,即一级结构、二级结构、三级结构以及四级结构。依据这种结构层次,将蛋白质数据库分为:①蛋白质序列数据库,例如蛋白质信息资源(PIR)、Swiss-Prot蛋白质序列数据库、美国国家生物技术信息中心(NCBI),这些数据库的数据主要以蛋白质的序列为主,并赋予相应的注释。②蛋白质模体及结构域数据库,如蛋白质家族和结构域的数据库(PROSITE)、蛋白质家族数据库(Pfam),这些数据库主要收集了蛋白质的保守结构域和功能域的特征序列。③蛋白质结构数据库,如布鲁克海文蛋白质数据库等,这些数据库主要以蛋白质的结构测量数据为主。④蛋白质分类数据库,如蛋白质结构的分类数据库(SCOP)、蛋白质结构分类数据库(CATH)、蛋白质家族数据库(FSSP)等,这其中又有以序列比较为基础的序列分类数据库以及以结构比较为基础的结构分类数据库之分。这些数据库种类有差别,但内部是相互联系的,每个数据库都有指针指向其他数据库,而且数据库之间的序列以及相应的结构是共享的,同一种蛋白质会依次出现在不同的数据库,这样的数据沟通有助于更深层地挖掘蛋白质的内在生物信息,这些数据库是融序列信息的索取、处理、存储、输出于一身的。

蛋白质数据库不论其数据为何种形式,都具备3种功能:①对数据的注释(annotation)功能。所有提交到数据库的数据都要由作者或数据库管理人员进行注释方能发布。②对数据的检索(search)功能。数据经注释之后,访问者可以通过数据库网页上提供的搜索引擎进行搜索,找到自己所需的蛋白质信息。③对数据的生物信息分析(analysis)功能。访问者一旦找到感兴趣的蛋白质,就可以运用数据库提供的生物信息分析工具对蛋白质序列的未知数据进行预测,如预测蛋白质的理化性质、预测蛋白质的二级结构及多重序列比对等。

  • 蒋彦,王小行,曹毅,等.基础生物信息学及应用.北京:清华大学出版社,2003.
  • 尚彤,国强华,景霞.常用医学生物信息学数据库.北京:北京大学医学出版社,2003.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!