摘要:隨著現(xiàn)代計(jì)算機(jī)技術(shù)發(fā)展速度的不斷加快,與生物信息學(xué)的融合也在逐漸地加深,所以其在生物信息學(xué)數(shù)據(jù)庫中得到了良好的應(yīng)用,建立和完善數(shù)據(jù)庫能夠促進(jìn)生物信息學(xué)的發(fā)展。本文主要闡述了生物信息學(xué)數(shù)據(jù)庫的概念,分析了數(shù)據(jù)庫在生物信息學(xué)中的作用及其分類和特點(diǎn),展望其發(fā)展前景,以期數(shù)據(jù)庫能夠在生物信息學(xué)中得到更加廣泛的應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)庫生物信息學(xué)作用前景
自二十世紀(jì)八十年代末人類基因組計(jì)劃啟動(dòng),由數(shù)學(xué)、化學(xué)、計(jì)算機(jī)科學(xué)以及信息科學(xué)等多種學(xué)科綜合而成的生物信息學(xué)獲得了迅猛的發(fā)展,眾多著名的科學(xué)家將生物信息學(xué)當(dāng)做二十一世紀(jì)自然科學(xué)的重要研究領(lǐng)域[1]。生物信息學(xué)指的是在生物學(xué)實(shí)驗(yàn)數(shù)據(jù)快速增長和計(jì)算機(jī)
網(wǎng)絡(luò)迅速發(fā)展的影響下所產(chǎn)生的生物學(xué)數(shù)據(jù),再通過數(shù)據(jù)提取新知識(shí)的一門學(xué)科,它主要是對(duì)生物系統(tǒng)中的調(diào)控規(guī)律、信息流的相互作用以及信息現(xiàn)象進(jìn)行研究,是一門實(shí)際應(yīng)用與理論并重的學(xué)科。
一、生物信息學(xué)數(shù)據(jù)庫的概述
近幾年來,各種生物學(xué)的實(shí)驗(yàn)數(shù)據(jù)不斷增多基礎(chǔ)生物信息學(xué)數(shù)據(jù)庫模型,生物學(xué)數(shù)據(jù)庫逐漸增加基礎(chǔ)生物信息學(xué)數(shù)據(jù)庫模型,這些數(shù)據(jù)庫對(duì)生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的處理和收集有各自的標(biāo)準(zhǔn),可以提供相關(guān)的數(shù)據(jù)處理和查詢等服務(wù)[2]。生物學(xué)
數(shù)據(jù)庫幾乎涉及到了生命科學(xué)的各個(gè)領(lǐng)域,世界上有關(guān)DNA的數(shù)據(jù)庫主要包括EMBL的EBI,NCBI的,以及DDBJ等;有關(guān)蛋白質(zhì)的數(shù)據(jù)庫主要包括PIR、MIPS、 以及等;有關(guān)于蛋白質(zhì)結(jié)構(gòu)分類的數(shù)據(jù)庫包括FSSP、CATH以及SCOP等。這些數(shù)據(jù)庫僅僅是簡單地對(duì)原始生物學(xué)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行歸類和整理,是基本數(shù)據(jù)庫。隨著生物數(shù)據(jù)庫的數(shù)量和種類不斷地增多,也變得越來越復(fù)雜,這也使數(shù)據(jù)庫面臨著更大的挑戰(zhàn)。因此多種基本數(shù)據(jù)庫融合而成的二次數(shù)據(jù)庫應(yīng)運(yùn)而生了,使人們在查詢數(shù)據(jù)庫時(shí)變得更加便利。
二、生物信息學(xué)數(shù)據(jù)庫的分類及特點(diǎn)
一級(jí)數(shù)據(jù)庫。一級(jí)數(shù)據(jù)庫在生物信息學(xué)數(shù)據(jù)庫中主要包含生物大分子的三維空間結(jié)構(gòu)數(shù)據(jù)庫、基因組數(shù)據(jù)庫以及蛋白質(zhì)和核酸一級(jí)結(jié)構(gòu)序列數(shù)據(jù)庫等,一般被稱作為基本數(shù)據(jù)庫。數(shù)據(jù)信息量較大是一級(jí)數(shù)據(jù)庫的優(yōu)勢,其中存儲(chǔ)了大量的信息,而且數(shù)據(jù)量每天都在不斷地增加,數(shù)據(jù)中的信息也能夠及時(shí)更新。一級(jí)數(shù)據(jù)庫的用戶人數(shù)多,應(yīng)用范疇也極為廣泛,所以,建立數(shù)據(jù)庫只有具備大容量、高性能的磁盤以及專門的計(jì)算機(jī),才能夠?qū)?shù)據(jù)進(jìn)行管理。
第1頁