首页 . 理学 . 生物学 . 生物工程 . 蛋白质工程 . 蛋白质工程 . 蛋白质功能分析 . 生物信息学分析 . 生物信息学数据库 . 核酸数据库

核酸数据库

/nucleic acid database; NDB/
条目作者华子春

华子春

最后更新 2023-07-28
浏览 200
最后更新 2023-07-28
浏览 200
0 意见反馈 条目引用

对含有核酸结构的数据进行处理、存档查询和分配的通用数据库。

英文名称
nucleic acid database; NDB
所属学科
生物学

其核心在于含有与核酸晶体结构相关的数据库。在良好策展数据的基础上,NDB创建了具有非常丰富的查询和报表功能的初级和衍生数据的关系数据库。核酸数据库是生物信息数据库中基本的数据库,与蛋白质数据库共同构成序列数据库,以核苷酸碱基顺序为基本内容,并附有注释信息。核酸序列数据库早期的数据主要由数据录入人员通过查阅文献杂志收集,或者由科研人员用磁盘、电子邮件方式向国际生物信息数据库中心递交。为了满足数据处理的需求,NDB创建了第一个用于核酸研究的软件。到1998年,存入程序数据库文件(program database file; PDB)的蛋白质/核酸晶体结构经处理后整合到NDB中,在结构生物信息学研究协同实验室承担PDB管理时,所有的大分子结构都由NDB开发的工具来处理。NDB继续提供高层次的核酸信息并作为特色数据库服务相关研究人员。

随着自动化测序技术的发展以及大规模测序计划的执行,世界上每分钟都有新核酸序列被测定。为了更高效地利用信息,建立生物信息中心,通过互联网实现全球范围的信息共享已经成为必然。主要有三大核酸序列数据库:欧洲生物信息学研究所(European Bioinformatics Institute; EBI)所维护的EMBL数据库、美国国家生物技术信息中心(National Center For Biotechnology Information; NCBI)的基因库(Genbank)数据库和日本国立遗传学研究所(Japan National Institute of Genetics Center for Information Biology)的DDBJ(DNA Data Bank of Japan)数据库。1988年,EMBL、GenBank与DDBJ共同成立了国际核酸序列联合数据库中心,建立了合作关系。根据协议,这3个数据库分别收集所在区域的有关实验室和测序机构所发布的核酸序列信息,并共享收集到的数据,从地域角度而言,EMBL主要负责收集欧洲的数据,Genbank主要收集负责美洲,DDBJ负责亚洲。这三大数据库虽然具有不同的数据记录格式,但是对于核酸序列均采用了相同的记录标准,同时每天都交换数据以达到数据的更新和一致。由于互联网的发展,用户可以任意地向其中任意一个数据库提交序列。所提交的序列也将从公布之日起同时在三大数据库中出现。

德国海德堡的欧洲分子生物学实验室(European Molecular Biology Laboratory)于1980年创建的,其名称也由此而来。 1994年9月随着欧洲生物信息学研究所(European Bioinformatics Institute; EBI)(http:// www.ebi.ac.uk)在英国剑桥建成,EMBL数据库由海德堡迁移至剑桥。EMBL数据库是DNA和RNA数据库,其数据来源主要通过科学文献、专利申请和直接投送,每日更新,每年发行4版。

美国国立卫生研究院(National Institutes of Health; NIH)于1982年委托洛斯阿拉莫斯(Los Alamos)国家实验室建立GenBank,后移交给美国国家生物技术信息中心,隶属于NIH下设的国家医学图书馆(National Liabraty of Medicine; NLM)。Genbank是DNA和RNA数据库,是国际核酸序列数据库合作项目的一部分,其数据来源于测序工作者提交的序列和由测序中心提交的大量表达序列标签(EST)序列及其他测序数据以及其他数据机构协作交换数据而来的数据。该数据库每天更新,每年发行6版。Genbank数据库里的数据来源于约100000个物种,其中56%是人类的基因组序列。每条GenBank数据记录包含对序列的简要描述、科学命名、物种分类名称、参考文献、序列特征表以及序列本身。序列特征表里包含对序列生物学特征注释,如编码区、转录单元、重复区域、突变位点或修饰位点等。所有数据记录被划分在若干个文件里,例如细菌类、病毒类、灵长类、啮齿类以及EST数据、基因组测序数据、大规模基因组序列数据等16类文件。

由位于日本静冈的日本国立遗传学研究所于1986年创建的日本DNA数据库。该数据库每年发行4版,其数据库格式与Genbank一致。

中国自主开发的核酸序列公共数据库,发表中国各基因研究中心提供的核酸序列,并接受中国核酸序列的注册登记,由中国科学院上海生命科学研究院生物信息中心维护。

Genbank数据库:http://www.ncbi.nlm.nih.gov/genebank/

EMBL数据库:http://www.ebi.ac.uk/embl/

DDBJ数据库:http://www.ddbj.nig.ac.jp/

  • 高勤学,等.基因操作技术.北京:中国环境科学出版社,2007.
  • BERMAN H M, JOHN W, FENG Z K, et al.The nucleic acid database.Acta crystallographica section D biological crystallography,2002,58(Pt 6 No 1):889-898.

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!