浙江大學(xué)生命科學(xué)學(xué)院 徐冰
浙江杭州 310029
1 國(guó)內(nèi)外研究現(xiàn)狀
擬南芥(Arabidopsis thaliana)是一種模式植物,具有基因組。125 Mbp)、生長(zhǎng)周期短等特點(diǎn),而且基因組測(cè)序已經(jīng)完成(The Arabidopsis Genomic Initiative, 2000)。同時(shí),擬南芥屬十字花科(Cruciferae),具有高等植物的一般特點(diǎn),擬南芥研究中所取得成果很容易用于其它高等植物包括農(nóng)作物的研究,產(chǎn)生重大的經(jīng)濟(jì)效益,特別是十字花科中還有許多重要的經(jīng)濟(jì)作物,與人類的生產(chǎn)生活密切相關(guān),因此目前擬南芥的研究越來越多地受到國(guó)際植物學(xué)及各國(guó)政府的重視。
從遺傳學(xué)的觀點(diǎn)來看,基因克隆的途徑可概括為正向遺傳學(xué)和反向遺傳學(xué)兩種。正向遺傳學(xué)途徑指的是通過被克隆基因的產(chǎn)物或表現(xiàn)型突變?nèi)ミM(jìn)行;反向遺傳學(xué)途徑則指的是依據(jù)被克隆基因在染色體上的位置來實(shí)現(xiàn)。雖然一些模式生物(如擬南芥)的基因組測(cè)序已經(jīng)完成,但還有40%的基因(在擬南芥中)的功能還是未知的。
圖1 圖位克隆所需努力的比較(1995年和2002年)(Jander等, 2002)
圖位克。map-based cloning)又稱定位克。positional cloning),1986年首先由劍橋大學(xué)的Alan Coulson提出(Coulson等,1986),用該方法分離基因是根據(jù)目的基因在染色體上的位置進(jìn)行的,無需預(yù)先知道基因的DNA序列,也無需預(yù)先知道其表達(dá)產(chǎn)物的有關(guān)信息。它是通過分析突變位點(diǎn)與已知分子標(biāo)記的連鎖關(guān)系來確定突變表型的遺傳基礎(chǔ)。近幾年來隨著擬南芥基因組測(cè)序工作的完成,各種分子標(biāo)記的日趨豐富和各種數(shù)據(jù)庫(kù)的完善,在擬南芥中克隆一個(gè)基因所需要的努力已經(jīng)大大減少了(圖1)。
目前完成整個(gè)擬南芥的圖位克隆過程大約需要一年時(shí)間。在這個(gè)過程中,我們從篩選突變體開始,逐漸找到和表型相關(guān)的基因。這和反向遺傳學(xué)的方法正好相反。圖位克隆能實(shí)現(xiàn),關(guān)鍵在于全基因組測(cè)序計(jì)劃的完成和各種分子標(biāo)記的發(fā)現(xiàn)。這些數(shù)據(jù)被儲(chǔ)存在專門的數(shù)據(jù)庫(kù)中(表1)(Lukowitz等, 2000)。在擬南芥中的圖位克隆,在很大程度上得益于對(duì)Col-0生態(tài)型測(cè)序的完成,因?yàn)樗窃谘芯繑M南芥時(shí)最常用的生態(tài)型。
實(shí)現(xiàn)基因圖位克隆的關(guān)鍵是篩選與目標(biāo)基因連鎖的分子標(biāo)記。實(shí)質(zhì)上,分子標(biāo)記是一個(gè)特異的DNA片段或能夠檢出的等位基因,對(duì)其有效地利用即可達(dá)到圖位克隆基因之目的。迄今為止,已有幾十種技術(shù)可用于分子標(biāo)記的篩選(Wang等,2000)。其中最為常用的是簡(jiǎn)單序列長(zhǎng)度多態(tài)性(SSLPs)(Lukowitz等, 2000; Choe等, 2002; Gonzalez-Guzman等, 2002)。和單核苷酸多態(tài)性(SNPs)(Rafalski, 2002)。SSLP是基于PCR的分子標(biāo)記,在擬南芥基因組中有較多分布,而且是共顯性的,它的檢測(cè)非常直接,但是我們需要設(shè)計(jì)引物來檢測(cè)假定的SSLP標(biāo)記;對(duì)SNPs標(biāo)記的檢測(cè)也比較直接,它是擬南芥不同生態(tài)型之間基因組中的單個(gè)核苷酸的差別,這些差別的核苷酸通常位于不編碼區(qū)域(Peters等, 2003)。最常見的用于檢測(cè)SNPs標(biāo)記的方法主要是剪切擴(kuò)增多態(tài)性序列(CAPS),它也是基于PCR的。另外,一種更為有效的方法衍生的CAPS(dCAPS)(Nam等, 1989; Michaels 和 Amasino, 1998)可把任何已知的點(diǎn)突變作為分子標(biāo)記,只要在PCR是引入不配對(duì)的引物,使擴(kuò)增的序列在一個(gè)生態(tài)型中具有限制性酶切位點(diǎn),而在另一生態(tài)型中沒有,以形成多態(tài)性。
圖位克隆法隨著相關(guān)配套技術(shù)(序列數(shù)據(jù)庫(kù)、分子標(biāo)記等)的日漸成熟,許多擬南芥及一些農(nóng)作物的基因已被成功的克。ū2)。本文擬對(duì)圖位克隆的研究進(jìn)展做一介紹,以期對(duì)植物遺傳育種和分子生物學(xué)研究有所幫助
表1 擬南芥網(wǎng)絡(luò)資源
網(wǎng)站
|
網(wǎng)址
|
Supplemental material for this paper
|
http://carnegiedpb.stanford.edu/methods/ppsuppl.html
|
Nottingham Stock Centre(U.K.)
|
http://nasc.nott.ac.uk/
|
Recombinant Inbred map
|
http://nasc.nott.ac.uk/new_ri_map.html
|
Ohio Stock Center(U.S.A.)
|
http://aims.cps.msu.edu/aims/
|
TAIR database*, homepage
|
http://www.arabidopsis.org
|
Recombinant Inbred map(mirror site)
|
http://www.arabidopsis.org/cgi-bin/maps/Riintromap
|
CAPS markers
|
http://www.arabidopsis.org/aboutcaps.html
|
Sequence table
|
http://www.arabidopsis.org/cgi-bin/maps/Seqtable.pl
|
SNP collection
|
http://www.arabidopsis.org/SNPs.html
|
CEREON collection of polymorphisms
|
http://www.arabidopsis.org/cereon
|
SSLP markers
|
http://genome.bio.upenn.edu/SSLP_info/SSLP.html
|
TIGR, genome annotations
|
http://www.tigr.org/tdb/athl/htmls/index.html
|
Database of Ler sequences
|
http://www.tigr.org/tdb/atgenome/Ler.html
|
Kasuza DNA Research Institute, genome annotations
|
http://www.kazusa.or.jp/kaos/
|
MIPS genome annotations
|
http://websvr.mips.biochem.mpg.de/proj/thal/
|
SINS database of transposon insertions
|
http://www.jic.bbsrc.ac.uk/sainsbury-lab/jonathan-jones/jjhome.htm
|
*注:The Arabidopsis Information Resource (TAIR)
|
2 圖位克隆的一般過程
因?yàn)橛辛藬M南芥的基因組序列和高密度的遺傳標(biāo)記,圖位克隆過程就變得相對(duì)直接。圖2例舉了一種高效的擬南芥圖位克隆方法。從基于Col-0和Ler遺傳背景的突變體出發(fā),我們有可能在大約一年時(shí)間內(nèi)找出與這個(gè)突變相關(guān)的基因,這其中主要耗時(shí)間的是五個(gè)植物(擬南芥)的生長(zhǎng)周期(我們假定每個(gè)周期為兩個(gè)月)。
作為作圖過程的第一步,突變體植株將和另外一個(gè)生態(tài)型(Col-0或者Ler)的植株雜交。在大多數(shù)情況下,用于雜交的突變體植株是作為父本還是母本是沒有關(guān)系的。然后播種F1代種子。在F1代植物的生長(zhǎng)過程中,我們就有可能來對(duì)其表現(xiàn)型和基因型進(jìn)行分析。F1代植物的表型的出現(xiàn)或者消失將顯示著我們所研究的突變是顯性的還是隱性的。最好通過對(duì)一些標(biāo)記的分析來確認(rèn)F1代植物是雜合體,而且在雜交過程中我們沒有犯錯(cuò)誤。當(dāng)然也有必要確認(rèn)原來的生態(tài)型背景。
表2 用圖位克隆方法得到的擬南芥及一些農(nóng)作物的基因
基因
|
突變表型
|
基因同源序列
|
AB13 |
脫落酸不敏感
|
玉米轉(zhuǎn)錄子
|
FID3
|
降低亞油酸飽和度
|
細(xì)菌去飽和酸酶
|
AXR1
|
生長(zhǎng)素抗性
|
泛素N 端活性酶
|
ETR1
|
乙烯抗性
|
雙因子調(diào)節(jié)子
|
ABI1
|
脫落酸不敏感
|
鈣調(diào)蛋白磷酸化酶
|
DET1
|
黃化損傷反應(yīng)
|
新核蛋白
|
RPS2
|
抗病
|
新型富含亮氨酸的蛋白酶
|
RPM1
|
抗病
|
激酶
|
RSW1
|
纖維素合成酶
|
細(xì)胞色素P450 家系
|
ZLL
|
調(diào)節(jié)中莖分生
|
細(xì)胞胚胎發(fā)育蛋白
|
PRT1
|
抑制胞間蛋白降解
|
控制植物N 端代謝
|
Tornadol
|
植株短化
|
——
|
IFL1
|
正常的維管束間纖維分化受阻
|
亮氨酸拉鏈蛋白
|
ARA1
|
樹膠醛糖激酶活性喪失
|
半乳糖激酶基因家族
|
VTC2
|
維生素C合成不足
|
果蠅蛋白CG3552,線蟲蛋白C10F3.4(功能未知)
|
AST
|
種皮花青苷斑點(diǎn)
|
花青苷生物合成途徑中的二氫黃酮醇-4-還原酶
|
圖2 圖位克隆過程示意圖(Jander等, 2002)
F1代植物自交得到F2代種子,大約播種600個(gè)個(gè)體以進(jìn)行突變基因的粗定位(first-pass mapping,圖2)。在其生長(zhǎng)過程中,我們可確定其表型,大約有150個(gè)個(gè)體被認(rèn)為是純合體(在隱性突變的情況下是純合突變體,在顯性突變的情況下是純合野生型)。然后從這150個(gè)個(gè)體的葉子或者其它組織中制備DNA用于基因型分析。起先用分布于擬南芥五條染色體上的25個(gè)標(biāo)記(相鄰的兩個(gè)標(biāo)記之間大約相距20 cM)進(jìn)行分析,確定突變基因是和哪個(gè)或者哪幾個(gè)標(biāo)記是連鎖的,然后用三點(diǎn)測(cè)交的方法來定義一個(gè)包含突變基因的大約20 cM的遺傳間隔。一旦這樣的一個(gè)遺傳間隔被定義之后,接下來的工作就是引入新的標(biāo)記把這個(gè)間隔縮小到大約4 cM。一般來說,利用150個(gè)F2代個(gè)體是在很大程度上能找到這樣一個(gè)遺傳間隔的,距離突變基因最近的兩個(gè)分子標(biāo)記將作為側(cè)面標(biāo)記而用于下面的進(jìn)一步分析。
下一步我們將播種一個(gè)更大的F2代群體用于突變基因的精細(xì)定位(fine-resolution mapping,圖2)。最終目標(biāo)是將包含突變基因的遺傳間隔縮小到40 Kb甚至更。ㄟ@在擬南芥中大約是0.16 cM)。顯然用于作圖的F2代植物越多,就越能精確地定位突變基因。一般需要3000~4000個(gè)F2代植物個(gè)體(包括粗定位時(shí)的600個(gè)F2代植物個(gè)體)來精確地定位突變基因。但是也有很多圖位克隆過程用了少于3000個(gè)F2代植物個(gè)體就成功地定位了突變基因(Lukowitz等, 2000)。但是這往往要冒因?yàn)樽鲌D群體不夠大再一次種植F2代植物而延長(zhǎng)整個(gè)作圖過程的時(shí)間的風(fēng)險(xiǎn)。
在這個(gè)大約4 cM的遺傳間隔內(nèi)找到與突變更緊密連鎖的分子標(biāo)記,一般情況下能在突變兩側(cè)找到相距小于40 Kb的兩個(gè)分子標(biāo)記。一旦這樣的兩個(gè)分子標(biāo)記被找到之后,就可以通過測(cè)序來找到突變基因。一種有效的方法是設(shè)計(jì)PCR引物來擴(kuò)增覆蓋這40 Kb的多個(gè)重疊的500 bp的片段。將這些片段測(cè)序后拼接起來以得到整個(gè)40 Kb的序列,然后將它與野生型植物(Col-0或者Ler)的序列進(jìn)行比對(duì),這就可以找到這個(gè)區(qū)域中的多個(gè)基因。從一系列侯選基因中鑒定基因是定位克隆技術(shù)的最后一個(gè)關(guān)鍵環(huán)節(jié),F(xiàn)在最常用的方法是用含有目標(biāo)基因的大片段克隆如BAC克隆或YAC克隆去篩選cDNA文庫(kù),并查詢生物數(shù)據(jù)信息庫(kù),待找出侯選基因后,把這些侯選基因進(jìn)行下列分析以確定目標(biāo)基因:(1)精確定位法檢查cDNA是否與目標(biāo)基因共分離;(2)檢查cDNA時(shí)空表達(dá)特點(diǎn)是否與表型一致;(3)測(cè)定cDNA序列,查詢數(shù)據(jù)庫(kù),以了解該基因的功能;(4)篩選突變體文庫(kù),找出DNA序列上的變化及與功能的關(guān)系;(5)進(jìn)行功能互補(bǔ)實(shí)驗(yàn),通過轉(zhuǎn)化突變體觀察突變體表型是否恢復(fù)正;虬l(fā)生預(yù)期的表型變化。功能互補(bǔ)實(shí)驗(yàn)是最直接、最終鑒定基因的方法。利用新興的RNA干擾(RNAi)也可有效地確定目的基因。
3 存在的問題
圖位克隆也有其自身的局限性,在某些情況下,就很難或者不能通過圖位克隆技術(shù)來定位基因。
在分析自然發(fā)生的變異的時(shí)候,我們最有可能遇到的復(fù)雜情況是一個(gè)給定的性狀是由不止一個(gè)的基因位點(diǎn)控制的。例如,在Kashmir-1(有抗性的)和Columbia(敏感的)株系之間的雜交實(shí)驗(yàn)中,我們發(fā)現(xiàn)粉狀霉菌抗性基因至少涉及三個(gè)遺傳位點(diǎn),它們是以附加的方式起作用的(I.Wilson, C. Schiff, 和 S. Somerville,個(gè)人交流)。對(duì)這些抗性基因中的任何一個(gè)作精細(xì)定位都要求降低作圖群體的遺傳復(fù)雜性,例如通過創(chuàng)造只有一個(gè)位點(diǎn)保持多態(tài)性的重組近交系。在擬南芥的株系之間雜交時(shí),很多種性狀是由一個(gè)或多個(gè)遺傳位點(diǎn)控制的,其中包括開花時(shí)間,種子大小,冬眠,生理節(jié)律,次生代謝以及表皮毛的密度(綜述見Alonso-Blanco 和 Koornneef,2000)。無論何時(shí),當(dāng)影響這些性狀的自然或者誘導(dǎo)的突變被定位的時(shí)候,第二位點(diǎn)修飾成分會(huì)干擾這些分析。
表觀(上位)遺傳突變這個(gè)術(shù)語是描述一個(gè)基因在表達(dá)和功能上的可遺傳改變,而不涉及DNA序列的改變(綜述見Wolffe 和 Matzke,1999),這是圖位克隆工程中又一個(gè)可能的復(fù)雜情況。已有文獻(xiàn)很好地證明的是花發(fā)育基因SUPERMAN的后生clark kant等位基因(Jacobson 和 Meyerowitz,1997)。這些等位基因是可遺傳的,但它們不穩(wěn)定有一個(gè)小的回復(fù)率。它們?cè)?em>SUPERMAN基因的DNA序列中都具有相似的胞嘧啶甲基化現(xiàn)象,結(jié)果,有可能減少了SUPERMAN基因轉(zhuǎn)錄子的表達(dá)。它們中沒有一個(gè)是和SUPERMAN的DNA序列改變聯(lián)系在一起的;盡管如此,它們能被帶有SUPERMAN基因的轉(zhuǎn)基因所補(bǔ)充。目前,對(duì)于這種表觀遺傳突變是怎么產(chǎn)生的以及它們出現(xiàn)的頻率知道的不多。
關(guān)于染色體上位點(diǎn)的物理和遺傳距離的比值是變化的。通常這種變化是比較小的,對(duì)作圖的分辨率也只有較小的影響(Copenhaver等,1998)。但是,有證據(jù)表明有些染色體區(qū)域是例外的。例如,對(duì)GURKE基因的圖位克隆就非常困難,這個(gè)基因的定位接近于第一條染色體的著絲粒;在著絲粒附近重組是嚴(yán)格限制的,使得對(duì)它精細(xì)定位的努力非常無效。而且,在這個(gè)區(qū)域中重復(fù)DNA單元的廣泛分布使我們辨認(rèn)出散布的單拷貝序列,這些單拷貝序列能產(chǎn)生有疑問的遺傳標(biāo)記(R. Torres Ruiz,個(gè)人交流)。這個(gè)發(fā)現(xiàn)是經(jīng)過對(duì)第二條染色體上的物理和遺傳距離之間的比值的系統(tǒng)地分析之后確認(rèn)的(Lin等,1999)。對(duì)這條染色體的幾乎全序列,1%重組的遺傳距離相當(dāng)于100~400 Kb的物理距離,平均是250 Kb。然而著絲粒區(qū)域是一個(gè)顯著的例外,在這里1%重組的遺傳距離相當(dāng)于1000~2500 Kb?磥碇档弥赋龅氖窃诂F(xiàn)存的物理圖譜中,擬南芥的五個(gè)著絲粒是沒有一個(gè)被完全覆蓋的。最近對(duì)著絲粒區(qū)域的分析顯示這些區(qū)域通常包含重復(fù)的DNA和幾乎不含表達(dá)的基因(Copenhaver等,1999)。因此,由于接近著絲粒,應(yīng)該沒有擬南芥基因是不服從圖位克隆策略的。
除了著絲粒,第二條染色體上也有一個(gè)小片段上1%重組的遺傳距離相當(dāng)于1000 Kb甚至更多。根據(jù)推測(cè),觀察到的低重組率現(xiàn)象可能是由于被用于作圖分析的株系的DNA序列的重排(Lin等,1999;Mayer等,1999)。第二和第四條染色體的DNA序列的比較顯示有些基因片段是在這兩條染色體之間被復(fù)制的(其中一個(gè)片段的大小是4.6 Mb),還有一個(gè)從線粒體基因組向第二條染色體轉(zhuǎn)移的DNA片段(Lin等,1999)。這些發(fā)現(xiàn)清楚地證明了擬南芥基因組的結(jié)構(gòu)是可以不斷改變的。因此,不同株系之間的遺傳變異可能不僅僅是由點(diǎn)突變和DNA重排導(dǎo)致的,這就從根本上給圖位克隆工程造成了嚴(yán)重的問題。舉例來說,如果在兩個(gè)株系之間發(fā)生倒轉(zhuǎn)的一個(gè)大約500 Kb的序列被用于形成的一個(gè)作圖群體,所有發(fā)生在這個(gè)倒轉(zhuǎn)內(nèi)的重組事件將產(chǎn)生不育的減數(shù)分裂產(chǎn)物。因此,不可能在這個(gè)倒轉(zhuǎn)序列內(nèi)對(duì)突變進(jìn)行作圖。到目前為止,發(fā)生在常見株系之間的這樣的DNA重排還沒有被報(bào)道過,確實(shí)應(yīng)該是這樣,因?yàn)樗鼈兒茈y被檢測(cè)到。在一個(gè)作圖實(shí)驗(yàn)中,它們的出現(xiàn)將很有可能被忽視直到最后一步。
有時(shí)候,T-DNA插入和輻射也被觀察到能導(dǎo)致DNA的重排(Shirley等,1992;Nacry等,1998;Laufs等,1999;Ogas等,1999)。因此,當(dāng)被作圖的突變是由這些方法產(chǎn)生的時(shí)候,類似的困難也有可能產(chǎn)生。但在這些情況下,至少有一定的可能性突變是和重排的一個(gè)或兩個(gè)斷裂點(diǎn)有關(guān)。
4 前景展望
目前,在擬南芥中的圖位克隆已經(jīng)不僅僅是一些專注的(和持久的)專家的工作了,而是每個(gè)人都能完成的工作。在過去的幾年中,產(chǎn)生了很多便宜但功能強(qiáng)大的工具,同時(shí)也有大量的信息被收集在免費(fèi)的數(shù)據(jù)庫(kù)中。利用這些資源,目前大部分的圖位克隆工程應(yīng)該是可以肯定的,直接的,也是簡(jiǎn)單的。隨著我們對(duì)擬南芥基因組結(jié)構(gòu)和變化的認(rèn)識(shí)的增長(zhǎng),情況將進(jìn)一步改善,因?yàn)檫@將有助于我們消除部分上面提到的仍然存在的復(fù)雜情況,或者至少使得它們可被控制。
參考文獻(xiàn)
1. Choe,S., Schmitz,R.J., Fujioka,S., Takatsuto,S., Lee,M.O., Yoshida,S., Feldmann,K.A., and Tax,F.E. (2002). Arabidopsis brassinosteroid-insensitive dwarf12 mutants are semidominant and defective in a glycogen synthase kinase 3 beta-like kinase. Plant Physiology 130, 1506-1515.
2. Gonzalez-Guzman,M., Apostolova,N., Belles,J.M., Barrero,J.M., Piqueras,P., Ponce,M.R., Micol,J.L., Serrano,R., and Rodriguez,P.L. (2002). The short-chain alcohol dehydrogenase ABA2 catalyzes the conversion of xanthoxin to abscisic aldehyde. Plant Cell 14, 1833-1846.
3. Jander,G., Norris,S.R., Rounsley,S.D., Bush,D.F., Levin,I.M., and Last,R.L. (2002b). Arabidopsis map-based cloning in the post-genome era. Plant Physiology 129, 440-450.
4. Lukowitz,W., Gillmor,C.S., and Scheible,W.R. (2000c). Positional cloning in arabidopsis. Why it feels good to have a genome initiative working for you. Plant Physiology 123, 795-805.
5. Michaels,S.D. and Amasino,R.M. (1998). A robust method for detecting single-nucleotide changes as polymorphic markers by PCR. Plant J. 14, 381-385.
6. Nam,H.G., Giraudat,J., Den Boer,B., Moonan,F., Loos,W., Hauge,B.M., and Goodman,H.M. (1989). Restriction Fragment Length Polymorphism Linkage Map of Arabidopsis thaliana. Plant Cell 1, 699-705.
7. Peters,J.L., Cnudde,F., and Gerats,T. (2003). Forward genetics and map-based cloning approaches. Trends in Plant Science 8, 484-491.
8. Rafalski,A. (2002). Applications of single nucleotide polymorphisms in crop genetics. Curr. Opin. Plant Biol. 5, 94-100.