自然界絕大多數(shù)生物體的遺傳信息貯存在DNA的核苷酸排列順序中。DNA是巨大的生物高分子,一般將細(xì)胞內(nèi)遺傳信息的攜帶者棗染色體所包含的DNA總體稱為基因組(genome)。同一物種的基因組DNA含量總是恒定的,不同物種間基因組大小和復(fù)雜程度則差異,一般講,進(jìn)化程度越高的生物體其基因組構(gòu)成越大、越復(fù)雜,見(jiàn)表。
某些有代表性的生物體內(nèi)DNA大小
分子量 堿基對(duì)(bp) 千堿基對(duì)(kb)
zui簡(jiǎn)單的微生物 SV40病毒 3×106 5×103 5
λ噬菌體 3.4×107 5×104 50
細(xì)菌 大腸桿菌 2.2×109 4.6×106 4600
哺乳動(dòng)物 小鼠 1.5×1012 2.3×109 230萬(wàn)
人 1.8×1012 2.8×109 280萬(wàn)
DNA分子中不同排列順序的DNA區(qū)段構(gòu)成特定的功能單位,即基因(gene)?;虻墓δ苋Q于DNA的一級(jí)結(jié)構(gòu)。一個(gè)DNA分子能攜帶多少基因呢?如果以1000~1500bp編碼一個(gè)基因計(jì)算,猿猴病毒SV40基因組DNA有5000堿基對(duì)(base pair,bp),可編碼5種基因,人類基因組含3×109bp DNA,理論上可編碼200萬(wàn)以上的基因,然而,由于哺乳動(dòng)物的基因含有內(nèi)含子(intorn),因而每個(gè)基因可長(zhǎng)達(dá)5000~8000bp,少數(shù)可達(dá)20,000bp。按這樣大小的基因進(jìn)行推算,人類基因組相當(dāng)于40~60萬(wàn)個(gè)基因。這可能嗎?雖然現(xiàn)在還不知道確切數(shù)字,但利用核酸雜交已測(cè)得哺乳類細(xì)胞含50,000~100,000種mRNA,由此推論整個(gè)基因組所含基因不會(huì)超過(guò)10萬(wàn)個(gè),只占全部基因組的6%,另外5~10%為rRNA等重復(fù)基因,其余80~90%屬于非編碼區(qū),沒(méi)有直接的遺傳學(xué)功能。DNA的復(fù)性動(dòng)力學(xué)研究發(fā)現(xiàn)這些非編碼區(qū)往往都是一些大量的重復(fù)序列,這些重復(fù)序列或集中成簇,或分散在基因之間,可能在DNA復(fù)制、調(diào)控中具有重要意義,并與生物進(jìn)化、種族特異性有關(guān)??梢?jiàn)原核細(xì)胞由于DNA分子較小,必須充分利用有限的核苷酸序列,這是真核基因組與原核基因組顯然不同之處。
真核基因組與原核基因組在結(jié)構(gòu)上還有很多不同的特點(diǎn),歸納如下:
1.真核生物基因組結(jié)構(gòu)特點(diǎn)
①真核生物基因組DNA與蛋白質(zhì)結(jié)合形成染色體,儲(chǔ)存于細(xì)胞核內(nèi),除配子細(xì)胞外,體細(xì)胞內(nèi)的基因組是雙份的(即雙倍體,diploid),即有兩份同源的基因組。
②真核細(xì)胞基因轉(zhuǎn)錄產(chǎn)物為單順?lè)醋?/span>(monocistron),即一個(gè)結(jié)構(gòu)基因轉(zhuǎn)錄、翻譯成一個(gè)mRNA分子,一條多肽鏈。
③存在大量重復(fù)序列,即在整個(gè)DNA中有許多重復(fù)出現(xiàn)的核苷酸順序,重復(fù)序列長(zhǎng)度可長(zhǎng)可短,短的僅含兩個(gè)核苷酸,長(zhǎng)的多達(dá)數(shù)百、乃千。重復(fù)頻率也不盡相同;高度重復(fù)序列重復(fù)頻率可達(dá)106次,包括衛(wèi)星DNA、反向重復(fù)序列和較復(fù)雜的重復(fù)單位組成的重復(fù)序列;中度重復(fù)序列可達(dá)103~104次,如為數(shù)眾多的Alu家族序列,KpnI家族,Hinf家族序列,以及一些編碼區(qū)序列如rRNA基因、tRNA基因、組蛋白基因等;單拷貝或低度重復(fù)序列,指在整個(gè)基因組中只出現(xiàn)一次或很少幾次的核苷酸序列,主要是編碼蛋白質(zhì)的結(jié)構(gòu)基因,在人基因組中占約60~65%,因此所含信息量zui大。
④基因組中不編碼的區(qū)域多于編碼區(qū)域。
⑤基因是不連續(xù)的,在真核生物結(jié)構(gòu)基因的內(nèi)部存在許多不編碼蛋白質(zhì)的間隔序列(intervening sequences),稱為內(nèi)含子(intron),編碼區(qū)則稱為外顯子(exon)。內(nèi)含子與外顯子相間排列,轉(zhuǎn)錄時(shí)一起被轉(zhuǎn)錄下來(lái),然后RNA中的內(nèi)含子被切掉,外顯子連接在一起成為成熟的mRNA,作為指導(dǎo)蛋白質(zhì)合成的模板。
⑥基因組遠(yuǎn)大于原核生物的基因組,具有許多復(fù)制起點(diǎn),而每個(gè)復(fù)制子的長(zhǎng)度較小。
2.原核生物基因組結(jié)構(gòu)特點(diǎn)
①基因組較小,沒(méi)有核膜包裹,且形式多樣,如病毒基因組可能是DNA,也可能是RNA,可能是單鏈的,也可能是雙鏈的,可能是閉環(huán)分子,也可能是線性分子;細(xì)菌染色體基因組則常為環(huán)狀雙鏈DNA分子,并與其的RNA和支架蛋白構(gòu)成一致密的區(qū)域,稱為類核(nucleoid)。
②功能相關(guān)的結(jié)構(gòu)基因常常串連在一起,并轉(zhuǎn)錄在同一個(gè)mRNA分子中,稱為多順?lè)醋?/span>mRNA(polycistronic mRNA),然后再加工成各種蛋白質(zhì)的模板mRNA。
③DNA分子絕大部分用于編碼蛋白質(zhì),不編碼部分(又稱間隔區(qū))通常包含控制基因表達(dá)的順序。例如,噬菌體ψx 174中只有5%是非編碼區(qū)。
④基因重疊是病毒基因組的結(jié)構(gòu)特點(diǎn),即同一段DNA段能夠編碼兩種甚至三種蛋白質(zhì)分子。
⑤除真核細(xì)胞病毒外,基因是連續(xù)的,即不含內(nèi)含子序列。