釀酒酵母作為一種模式生物在實驗系統(tǒng)研究方面具有許多內(nèi)在的優(yōu)勢。首先,酵母是一種單細胞生物,能夠在基本培養(yǎng)基上生長,使得實驗者能夠通過改變物理或化學(xué)環(huán)境完全控制其生長。其次,酵母在單倍體和二倍體的狀態(tài)下均能生長,并能在實驗條件下較為方便地控制單倍體和二倍體之間的相互轉(zhuǎn)換,對其基因功能的研究十分有利。如在單倍體狀態(tài)下,只需一次基因替換,就能得到某個特定基因缺失的酵母株;而對于一些缺失后致死的基因,人們可以在二倍體菌株中進行基因替換,然后通過孢子篩選,獲得帶有基因缺失的單倍體菌株。此外,酵母的生命周期很適合經(jīng)典的遺傳學(xué)分析,使得在酵母16條染色體上構(gòu)建精細的遺傳圖譜成為可能。更重要的是,目前已發(fā)展了一些非常有效的技術(shù)使得酵母基因組中6000個基因中的任何一個基因均能被突變的等位基因取代,甚至從基因組中完全缺失,這種方法具有很高的效率和準確性[1~3]。
1.酵母基因組組成
在釀酒酵母測序計劃開始之前,人們通過傳統(tǒng)的遺傳學(xué)方法已確定了酵母中編碼RNA或蛋白質(zhì)的大約2600個基因[4]。通過對釀酒酵母的完整基因組測序,發(fā)現(xiàn)在12068kb的全基因組序列中有5885個編碼專一性蛋白質(zhì)的開放閱讀框。這意味著在酵母基因組中平均每隔2kb就存在一個編碼蛋白質(zhì)的基因,即整個基因組有72%的核苷酸順序由開放閱讀框組成[5]。這說明酵母基因比其它高等真核生物基因排列緊密。如在線蟲基因組中,平均每隔6kb存在一個編碼蛋白質(zhì)的基因[6];在人類基因組中,平均每隔30kb或更多的堿基才能發(fā)現(xiàn)一個編碼蛋白質(zhì)的基因。酵母基因組的緊密性是因為基因間隔區(qū)較短與基因中內(nèi)含子稀少。酵母基因組的開放閱讀框平均長度為1450bp即483個密碼子,最長的是位于XII號染色體上的一個功能未知的開放閱讀框(4910個密碼子),還有極少數(shù)的開放閱讀框長度超過1500個密碼子。在酵母基因組中,也有編碼短蛋白的基因,例如,編碼由40個氨基酸組成的細胞質(zhì)膜蛋白脂質(zhì)的PMP1基因。此外,酵母基因組中還包含:約140個編碼RNA的基因,排列在XII號染色體的長末端;40個編碼SnRNA的基因,散布于16條染色體;屬于43個家族的275個tRNA基因也廣泛分布于基因組中。表1提供了酵母基因在各染色體上分布的大致情況。
表1 酵母染色體簡況
染色體編號 |
長度(bp) | 基因數(shù) | tRNA基因數(shù) |
I | 23×103 | 89 | 4 |
II | 807188 | 410 | 13 |
III | 315×103 | 182 | 10 |
IV | 1531974 | 796 | 27 |
V | 569202 | 271 | 13 |
VI | 270×103 | 129 | 10 |
VII | 1090936 | 572 | 33 |
VIII | 561×103 | 269 | 11 |
IX | 439886 | 221 | 10 |
X | 745442 | 379 | 24 |
XI | 666448 | 331 | 16 |
XII | 1078171 | 534 | 22 |
XIII | 924430 | 459 | 21 |
XIV | 784328 | 419 | 15 |
XV | 1092283 | 560 | 20 |
XVI | 948061 | 487 | 17 |
序列測定揭示了酵母基因組中大范圍的堿基組成變化。多數(shù)酵母染色體由不同程度的、大范圍的GC豐富DNA序列和GC缺乏DNA序列鑲嵌組成[5、7]。這種GC含量的變化與染色體的結(jié)構(gòu)、基因的密度以及重組頻率有關(guān)。GC含量高的區(qū)域一般位于染色體臂的中部,這些區(qū)域的基因密度較高;GC含量低的區(qū)域一般靠近端粒和著絲粒,這些區(qū)域內(nèi)基因數(shù)目較為貧乏[5、8]。Simchen等證實[9],酵母的遺傳重組即雙鏈斷裂的相對發(fā)生率與染色體的GC豐富區(qū)相耦合,而且不同染色體的重組頻率有所差別,較小的Ⅰ、Ⅲ、Ⅳ和Ⅸ號染色體的重組頻率比整個基因組的平均重組頻率高。?
酵母基因組另一個明顯的特征是含有許多DNA重復(fù)序列,其中一部分為完全相同的DNA序列,如rDNA與CUP1基因、Ty因子及其衍生的單一LTR序列等[8]。在開放閱讀框或者基因的間隔區(qū)包含大量的三核苷酸重復(fù),引起了人們的高度重視。因為一部分人類遺傳疾病是由三核苷酸重復(fù)數(shù)目的變化所引起的。還有更多的DNA序列彼此間具有較高的同源性,這些DNA序列被稱為遺傳豐余(genetic redundancy)[8、10]。酵母多條染色體末端具有長度超過幾十個kb的高度同源區(qū),它們是遺傳豐余的主要區(qū)域,這些區(qū)域至今仍然在發(fā)生著頻繁的DNA重組過程。遺傳豐余的另一種形式是單個基因重復(fù),其中以分散類型最為典型,另外還有一種較為少見的類型是成簇分布的基因家族。成簇同源區(qū)(cluster homology region,簡稱CHR)是酵母基因組測序揭示的一些位于多條染色體的同源大片段,各片段含有相互對應(yīng)的多個同源基因,它們的排列順序與轉(zhuǎn)錄方向十分保守,同時還可能存在小片段的插入或缺失。這些特征表明,成簇同源區(qū)是介于染色體大片段重復(fù)與完全分化之間的中間產(chǎn)物,因此是研究基因組進化的良好材料,被稱為基因重復(fù)的化石[5、8]。染色體末端重復(fù)、單個基因重復(fù)與成簇同源區(qū)組成了酵母基因組遺傳豐余的大致結(jié)構(gòu)。研究表明,遺傳豐余中的一組基因往往具有相同或相似的生理功能,因而它們中單個或少數(shù)幾個基因的突變并不能表現(xiàn)出可以辨別的表型,這對酵母基因的功能研究是很不利的。所以許多酵母遺傳學(xué)家認為,弄清遺傳豐余的真正本質(zhì)和功能意義,以及發(fā)展與此有關(guān)的實驗方法,是揭示酵母基因組全部基因功能的主要困難和中心問題。
2.酵母基因組分析
在酵母基因組測序以前,人們已知道在酵母和哺乳動物中有大量基因編碼類似的蛋白質(zhì)[11]。對于一些編碼結(jié)構(gòu)蛋白質(zhì)(如核糖體和細胞骨架中的)在內(nèi)的同源基因,人們并不感到意外。但某些同源基因卻出乎人們意料,如在酵母中發(fā)現(xiàn)的兩個同源基因RAS1和RAS2與哺乳動物的H-ras原癌基因高度同源。酵母細胞如同時缺乏RAS1和RAS2基因,呈現(xiàn)致死表型。在1985年,首次應(yīng)用RAS1和RAS2基因雙重缺陷的酵母菌株進行了功能保守性檢測,結(jié)果表明,當哺乳動物的H-ras基因在RAS1和RAS2基因雙重缺陷的酵母菌株中表達時,酵母菌株可以恢復(fù)生長。因此,酵母的RAS1和RAS2基因不僅與人類的H-ras原癌基因在核苷酸順序上高度同源,而且在生物學(xué)功能方面保守。
隨著整個酵母基因組測序計劃的完成,人們可以估計有多少酵母基因與哺乳動物基因具有明顯的同源性。Botstein等將所有的酵母基因同GenBank數(shù)據(jù)庫中的哺乳動物基因進行比較(不包括EST順序),發(fā)現(xiàn)有將近31%編碼蛋白質(zhì)的酵母基因或者開放閱讀框與哺乳動物編碼蛋白質(zhì)的基因有高度的同源性[12]。因為數(shù)據(jù)庫中并未能包含所有編碼哺乳動物蛋白質(zhì)的序列,甚至不能包括任何一個蛋白質(zhì)家族的所有成員,所以上述結(jié)果無疑會被低估。酵母與哺乳動物基因的同源性往往僅限于單個的結(jié)構(gòu)域而非整個蛋白質(zhì),這反映了在蛋白質(zhì)進化過程中功能結(jié)構(gòu)域發(fā)生了重排。在酵母5800多個編碼蛋白質(zhì)的基因中,約41%(~2611個)是通過傳統(tǒng)遺傳學(xué)方法發(fā)現(xiàn)的,其余都是通過DNA序列測定所發(fā)現(xiàn)。約有20%酵母基因編碼的蛋白質(zhì)與其它生物中已知功能的基因產(chǎn)物具有不同程度的同源性(其中約6%表現(xiàn)出很強的同源性,約12%表現(xiàn)出稍弱的同源性),從而能初步推測其生物學(xué)功能。酵母基因組中有10%基因(約653個)與其它生物中功能未知的蛋白質(zhì)的基因具有同源性,被稱為孤兒基因?qū)蚬聝夯蚣易?orphan pairs or family);約25%的基因(~1544個)則與所有已發(fā)現(xiàn)的蛋白質(zhì)的基因沒有同源性,屬首次發(fā)現(xiàn)的新基因,是真正意義上的孤兒基因[5、13]。這些孤兒基因的發(fā)現(xiàn)是酵母基因組計劃的重要收獲,對于其功能的闡明,將大大推進對酵母生命過程的認識,因而引起了眾多遺傳學(xué)家的重視。
為了系統(tǒng)地分析酵母基因組測序發(fā)現(xiàn)的3000多個新基因的功能,1996年1月,隨著DNA測序工作的結(jié)束,歐洲建立了名為EUROFAN(European Functional Analysis Network)的研究網(wǎng)絡(luò)。這一網(wǎng)絡(luò)由歐洲14個國家的144個實驗室組成,它包括服務(wù)共同體(service consortia,A1-A4)、研究共同體(research consortia,B0?B9)和特定功能分析部(specific functional analysis nodes,N1-N14)三部分,每個部分下設(shè)許多小的分支機構(gòu)。其中研究共同體中的B0部門負責制作特定的酵母基因缺失突變株。缺失突變株的制作采用新發(fā)展起來的PCR介導(dǎo)的基因置換方法進行,即將來自細菌的卡那霉素抗性基因(KanMX)與線狀真菌Ashbya gossypil的啟動子和終止序列構(gòu)建成表達單元,它可賦予酵母細胞G418以抗性。然后,根據(jù)所要置換的染色體DNA序列設(shè)計PCR引物,這些引物的外側(cè)與染色體DNA序列同源,內(nèi)側(cè)則保證通過PCR可以擴增出KanMX基因,PCR產(chǎn)物直接用于基因置換操作[14]。通過這項技術(shù),可以有目的地將新發(fā)現(xiàn)的基因用KanMX置換,造成基因缺失突變,隨后通過系統(tǒng)地研究這些酵母缺失突變株表型有無改變(如生活力、生長速度、接合能力等)以確定這些基因的功能[15]。此種方法中有兩個方面的問題限制實驗進程:其一是大部分的突變子(60%~80%)并不顯示明顯的突變表型,這往往與前面提到的遺傳豐余有關(guān);其二是許多突變子即使發(fā)生了表型改變,也不能反映其編碼蛋白質(zhì)的功能,如某些突變子不能在高溫或高鹽的環(huán)境中生長,但這些表型卻不能提示任何有關(guān)缺失蛋白質(zhì)在生理功能方面的信息。
3.酵母作為模式生物的作用
酵母作為高等真核生物特別是人類基因組研究的模式生物,其最直接的作用體現(xiàn)在生物信息學(xué)領(lǐng)域。當人們發(fā)現(xiàn)了一個功能未知的人類新基因時,可以迅速地到任何一個酵母基因組數(shù)據(jù)庫中檢索與之同源的功能已知的酵母基因,并獲得其功能方面的相關(guān)信息,從而加快對該人類基因的功能研究。研究發(fā)現(xiàn),有許多涉及遺傳性疾病的基因均與酵母基因具有很高的同源性,研究這些基因編碼的蛋白質(zhì)的生理功能以及它們與其它蛋白質(zhì)之間的相互作用將有助于加深對這些遺傳性疾病的了解。此外,人類許多重要的疾病,如早期糖尿病、小腸癌和心臟疾病,均是多基因遺傳性疾病,揭示涉及這些疾病的所有相關(guān)基因是一個困難而漫長的過程,酵母基因與人類多基因遺傳性疾病相關(guān)基因之間的相似性將為我們提高診斷和治療水平提供重要的幫助。
酵母作為模式生物的最好例子體現(xiàn)在那些通過連鎖分析、定位克隆然后測序驗證而獲得的人類遺傳性疾病相關(guān)基因的研究中,后者的核苷酸序列與酵母基因的同源性為其功能研究提供了極好的線索。例如,人類遺傳性非息肉性小腸癌相關(guān)基因與酵母的MLH1、MSH2基因,運動失調(diào)性毛細血管擴張癥相關(guān)基因與酵母的TEL1基因,布盧姆氏綜合征相關(guān)基因與酵母的SGS1基因,都有很高的同源性(見表2)。遺傳性非息肉性小腸癌基因在腫瘤細胞中表現(xiàn)出核苷酸短重復(fù)順序不穩(wěn)定的細胞表型,而在該人類基因被克隆以前,研究工作者在酵母中分離到具有相同表型的基因突變(msh2和mlh1突變)。受這個結(jié)果啟發(fā),人們推測小腸癌基因是MSH2和MLH1的同源基因,而它們在核苷酸序列上的同源性則進一步證實了這一推測。布盧姆氏綜合征是一種臨床表現(xiàn)為性早熟的遺傳性疾病,病人的細胞在體外培養(yǎng)時表現(xiàn)出生命周期縮短的表型,而其相關(guān)基因則與酵母中編碼蝸牛酶的SGS1基因具有很高的同源性。與來自布盧姆氏綜合征個體的培養(yǎng)細胞相似,SGS1基因突變的酵母細胞表現(xiàn)出顯著縮短的生命周期[16]。Francoise等研究了170多個通過功能克隆得到的人類基因,發(fā)現(xiàn)它們中有42%與酵母基因具有明顯的同源性,這些人類基因的編碼產(chǎn)物大部分與信號轉(zhuǎn)導(dǎo)途徑、膜運輸或者DNA合成與修復(fù)有關(guān),而那些與酵母基因沒有明顯同源性的人類基因主要編碼一些膜受體、血液或免疫系統(tǒng)組分,或人類特殊代謝途徑中某些重要的酶和蛋白質(zhì)[17]。
表2 與定位克隆的人類疾病基因高度同源的釀酒酵母基因
人類疾病 |
人類基因 |
人類cDNA |
酵母基因 | 酵母cDNA GenBank登記號 |
酵母基因功能 |
遺傳性非息肉性小腸癌 |
MSH2 |
U03911 | MSH2 | M84170 |
DNA修復(fù)蛋白 |
遺傳性非息肉性小腸癌 | MLH1 | U07418 | MLH1 | U07187 |
DNA修復(fù)蛋白 |
囊性纖維變性 | CFTR | N28668 | YCF1 | L35237 | 金屬抗性蛋白 |
威爾遜氏病 | WND | U11700 | CCC2 | L36317 | 銅轉(zhuǎn)運器 |
甘油激酶缺乏癥 | GK | L13943 | GUT1 | X69049 |
甘油激酶 |
布盧姆氏綜合癥 | BLM | U39817 | SGS1 | U22341 | 蝸牛酶 |
X-連鎖的腎上腺腦白質(zhì)營養(yǎng)不良 | ALD | Z21876 | PAL1 | L38491 | 過氧化物酶轉(zhuǎn)運器 |
共濟失調(diào)性毛細血管擴張癥 | ATM | U26455 | TEL1 | U31331 | P13激酶 |
肌萎縮性脊髓側(cè)索硬化 | SOD1 | K00065 | SOD1 | J03279 | 過氧化物歧化酶 |
營養(yǎng)不良性肌萎縮 | DM | L19268 | YPK1 | M21307 | 絲氨酸/蘇氨酸蛋白激酶 |
勒韋氏綜合癥 | OCRL | M88162 | YIL002C | X47047 | IPP-5-磷酸酶 |
I-型神經(jīng)纖維瘤 | NF1 | M89914 | IRA2 | M33779 | 抑制性的調(diào)節(jié)蛋白 |
隨著獲得高等真核生物更多的遺傳信息,人們將會發(fā)現(xiàn)有更多的酵母基因與高等真核生物基因具有同源性,因此酵母基因組在生物信息學(xué)領(lǐng)域的作用會顯得更加重要,這同時也會反過來促進酵母基因組的研究。與酵母相比,高等真核生物具有更豐富的表型,從而彌補了酵母中某些基因突變沒有明顯表型改變的不足。下面將要提到的例子正說明了酵母和人類基因組研究相互促進的關(guān)系。人類著色性干皮病是一種常染色體隱性遺傳的皮膚疾病,極易發(fā)展成為皮膚癌。早在1970年Cleaver等就曾報道,著色性干皮病和紫外線敏感的酵母突變體都與缺乏核苷酸切除修復(fù)途徑(nucleotide excision repair,NER)有關(guān)[18]。1985年,第一個NER途徑相關(guān)基因被測序并證實是酵母的RAD3基因[19]。1987年,Sung首次報道酵母Rad3p能修復(fù)真核細胞中DNA解旋酶活力的缺陷[20]。1990年,人們克隆了著色性干皮病相關(guān)基因xPD,發(fā)現(xiàn)它與酵母NER途徑的RAD3基因有極高的同源性[21]。隨后發(fā)現(xiàn)所有人類NER的基因都能在酵母中找到對應(yīng)的同源基因。重大突破來源于1993年,發(fā)現(xiàn)人類xPBp和xPDp都是轉(zhuǎn)錄機制中RNA聚合酶Ⅱ的TFⅡH復(fù)合物的基本組分[22]。于是人們猜測xPBp和xPDp在酵母中的同源基因(RAD3和RAD25) 也應(yīng)該具有相似的功能,依此線索很快獲得了滿意的結(jié)果并證實了當初的猜測[23]。
酵母作為模式生物的作用不僅是在生物信息學(xué)方面的作用,酵母也為高等真核生物提供了一個可以檢測的實驗系統(tǒng)。例如,可利用異源基因與酵母基因的功能互補以確證基因的功能。據(jù)Bassett的不完全統(tǒng)計,到1996年7月15日,至少已發(fā)現(xiàn)了71對人類與酵母的互補基因,這些酵母基因可分為六個類型:(1)20個基因與生物代謝包括生物大分子的合成、呼吸鏈能量代謝以及藥物代謝等有關(guān);(2)16個基因與基因表達調(diào)控相關(guān),包括轉(zhuǎn)錄、轉(zhuǎn)錄后加工、翻譯、翻譯后加工和蛋白質(zhì)運輸?shù)龋?3)1個基因是編碼膜運輸?shù)鞍椎模?4)7個基因與DNA合成、修復(fù)有關(guān);(5)7個基因與信號轉(zhuǎn)導(dǎo)有關(guān);(6)17個基因與細胞周期有關(guān),F(xiàn)在,人們發(fā)現(xiàn)有越來越多的人類基因可以補償酵母的突變基因,因而人類與酵母的互補基因的數(shù)量已遠遠超過過去的統(tǒng)計。
在酵母中進行功能互補實驗無疑是一種研究人類基因功能的捷徑。如果一個功能未知的人類基因可以補償酵母中某個具有已知功能的突變基因,則表明兩者具有相似的功能。而對于一些功能已知的人類基因,進行功能互補實驗也有重要意義。例如與半乳糖血癥相關(guān)的三個人類基因GALK2(半乳糖激酶)、GALT(UDP-半乳糖轉(zhuǎn)移酶)和GALE(UDP-半乳糖異構(gòu)酶)能分別補償酵母中相應(yīng)的GAL1、GAL7、GAL10基因突變。在進行互補實驗以前,人類和酵母的乳糖代謝途徑都已十分清楚,對有關(guān)幾種酶的活性檢測法也十分健全,并已獲得其純品,可以進行一系列生化分析。隨著人類三個半乳糖血癥相關(guān)基因的克隆分離成功,功能互補實驗成為可能,從而在遺傳學(xué)水平進一步確證了人類半乳糖血癥相關(guān)基因與酵母基因的保守性。人們又將這一成果予以推廣,利用酵母系統(tǒng)進行半乳糖血癥的檢測和基因治療,如區(qū)別真正的突變型和遺傳多態(tài)性,在酵母中模擬多種突變型的組合表型,或篩選基因內(nèi)或基因間的抑制突變等[24]。這些方法也同樣適用于其它遺傳病的研究。
利用異源基因與酵母基因的功能,還能使酵母成為其它生物新基因的篩查工具。通過使用特定的酵母基因突變株,對人類cDNA表達文庫進行篩選,從而獲得互補的克隆。如Tagendreich等利用酵母的細胞分裂突變型(cdc mutant)分離到多個在人類細胞有絲分裂過程中起作用的同源基因[25]。利用此方法,人們還克隆分離到了農(nóng)作物、家畜和家禽等的多個新基因[26]。 為了充分發(fā)揮酵母作為模式生物的作用,除了發(fā)展酵母生物信息學(xué)和健全異源基因在酵母中進行功能互補的研究方法外,通過建立酵母最小的基因組也是一個可行的途徑。酵母最小的基因組是指所有明顯豐余的基因減少到允許酵母在實驗條件下的合成培養(yǎng)基中生長的最小數(shù)目[10、27]。人類cDNA克隆與酵母中功能已知基因缺陷型進行遺傳互補可以確定人類新基因的功能,但是這種互補實驗會受到酵母基因組中其它豐余基因的影響。如果構(gòu)建的酵母最小基因組中所保留的基因可以被人類或者病毒的DNA序列完全替換,那么替換后的表型將完全取決于外源基因,這將成為一種篩選抗癌和抗病毒藥物的分析系統(tǒng)。?
參考文獻
[1]Rothstein RJ. Methods Enzymol,1983,101:202~211
[2]Baudin A et al. Nucleic Acids Res,1993,21:3329~3330
[3]Wach A et al. Yeast,1994,10:1793~1808
[4]Mortimer RK et al. Yeast,1992,8:817~902
[5]Dujon B. Trends Genet,1996,12:263~270
[6]Hodgkin J et al. Science,1994,270:410
[7]Sharp PM et al. Nucleic Acids Res,1993,21:179~183
[8]Goffeau A et al. Science,1996,274:546
[9]Zenvirth D et al. EMBO J,1992,11:3441~3447
[10]Oliver SG. Microbiology,1997,143:1483~1487
[11]Botstein D et al. Science,1988,240:1439~1443
[12]Botstein D et al. Science,1997,277:1259~1260
[13]Heumann K et al. Max-planck?institute fur Biochemie,Germany,1997,82152
[14]Wach A. Yeast,1996,12:259~265
[15]Oliver S. Trends Genet,1996,12:241~242
[16]Sinclair DA et al. Science,1997,277:1313~1316
[17]Francoise F. Gene,1997,195:1~10
[18]Cleaver JE. Photobiol,11:547~550
[19]Reynolds P et al. Nucleic Acids Res,13:2357~2372
[20]Sung P. Proc Natl Acad Sci USA,1987,84:8951~8955
[21]Weber CA et al. EMBO J,1990,9:1343~1347
[22]Schaeffer L et al. Science,1993,260:58~63
[23]Feaver WJ et al. Cell,75:1379~1387
[24]Quimby BB et al. Am J Hum Genet,1997,61:590~598
[25]Tugendreich S et al. Cell,1997,81:261~268
[26]Taylor RM et al. Plant J,1998,14:75~81
[27]Oliver SG. Nature,1996,379:597~600