轉(zhuǎn)錄組測序,無疑是分子生物學(xué)研究領(lǐng)域大家最熟悉、使用最多的組學(xué)技術(shù)之一。轉(zhuǎn)錄組測序可以為我們?nèi)娴靥峁颖緝?nèi)基因轉(zhuǎn)錄表達(dá)量的信息。通過常用的分析方法(例如表達(dá)差異分析、功能分析等),我們可以快速知曉樣本間的轉(zhuǎn)錄差異的總體規(guī)律(例如,樣本間的差異主要涉及哪些通路,發(fā)生在細(xì)胞的哪些位置)。 但轉(zhuǎn)錄組測序的不足也是顯而易見的。因?yàn)檗D(zhuǎn)錄組測序結(jié)果本身就是一張表格,我們無法直接獲知基因間錯綜復(fù)雜的調(diào)控關(guān)系。但當(dāng)你想進(jìn)一步理清一些更關(guān)鍵的問題,就會遇到困難,例如:這些基因間的關(guān)鍵調(diào)控關(guān)系是什么?導(dǎo)致這些成百上千的基因發(fā)生變化的關(guān)鍵驅(qū)動基因是什么?回答以上的這些問題非常重要。 因?yàn)椤案蓾窠Y(jié)合”是后組學(xué)時代研究的主旋律,如果我們無法從一堆轉(zhuǎn)錄組測序數(shù)據(jù)中找到核心調(diào)控點(diǎn),那么測序數(shù)據(jù)就無法有效、準(zhǔn)確地指導(dǎo)我們進(jìn)行下一步分子生物學(xué)實(shí)驗(yàn)?!稗D(zhuǎn)錄組測完了,現(xiàn)在我該做什么?”相信很多測過序的人都曾有過這樣的疑問。 圖1 轉(zhuǎn)錄組測序需要結(jié)合多組學(xué)才有利于找到核心調(diào)控關(guān)系 從另一個角度來考慮,細(xì)胞內(nèi)部本身是一個非常復(fù)雜的調(diào)控系統(tǒng)。當(dāng)我們只使用轉(zhuǎn)錄組這一種組學(xué)信息,那么情形自然就如同盲人摸象,從少量有限的信息難以理清事物的本質(zhì)。好在我們不僅僅只有一種工具,結(jié)合其他不同維度的組學(xué)信息,例如DNA組學(xué)的變異信息,蛋白組學(xué),表觀組學(xué)等,通過不同組學(xué)的貫穿分析,往往可以幫助我們縮小范圍,找到核心調(diào)控點(diǎn)。 圖2 DNA與RNA之間有很多變化可能發(fā)生 在眾多可能性中,轉(zhuǎn)錄前調(diào)控起著非常重要的作用。因?yàn)閺腄NA到RNA之間有一片巨大的“舞臺”——染色質(zhì)。如果把染色質(zhì)比作一片“草原”的話,這片草原中生存著眾多 “表觀/轉(zhuǎn)錄調(diào)控分子”的“物種”。這片草原中發(fā)生著的“物種”之間復(fù)雜的競爭、協(xié)同作用,其精彩程度絕不亞于非洲大草原。我們先來看看,染色質(zhì)這片草原的“核心植被”大概長什么樣子。 這片草原“植被”的基本結(jié)構(gòu)是由DNA纏繞著核小體構(gòu)成。核小體是由H3、H4、H2A和H2B四種組蛋白構(gòu)成的八聚物。DNA繞行核小體一圈的長度大概是147bp。我們都知道DNA是關(guān)鍵遺傳物質(zhì),但這些DNA所依附的核小體絕對是不可忽略的物質(zhì)。在以上的DNA-核小體的基本架構(gòu)的基礎(chǔ)上,很多調(diào)控分子在這片草原生機(jī)勃勃地生長起來。我們這里要提到4類關(guān)鍵的調(diào)控因素。 圖3 染色質(zhì)“草原”生機(jī)勃勃 轉(zhuǎn)錄因子(Transcription factors)的重要性自然毋庸置疑。我們都知道在啟動轉(zhuǎn)錄前,需要轉(zhuǎn)錄因子這種特別的蛋白結(jié)合在DNA上,進(jìn)而招募其他的關(guān)鍵分子(例如RNA聚合酶II)進(jìn)一步全面啟動轉(zhuǎn)錄。那么轉(zhuǎn)錄因子與DNA結(jié)合,是非常重要的步驟。但結(jié)合本身意味著需要空間,類似我們要在地鐵里坐下,前提是地鐵里有空位。 轉(zhuǎn)錄因子要在DNA上“坐下”就意味著DNA上有空位。但如果上文提到的,大部分DNA區(qū)域與核小體纏繞著,這意味著這些DNA區(qū)域是沒有“空位”的。要讓轉(zhuǎn)錄因子能夠正確工作,那么就要求基因組DNA某些區(qū)域不與核小體纏繞,處于“開放”狀態(tài)。 所以,我們將這種不被核小體占據(jù),對轉(zhuǎn)錄因子等轉(zhuǎn)錄調(diào)控蛋白的結(jié)合處于開放狀態(tài)的區(qū)域,稱為開放染色質(zhì)區(qū)(open chromatin)。相對應(yīng)的,被核小體占據(jù),對轉(zhuǎn)錄因子等轉(zhuǎn)錄調(diào)控蛋白的結(jié)合處于拒絕狀態(tài)的區(qū)域,稱為閉合染色質(zhì)區(qū)(Closed chromatin)。這種染色質(zhì)的開放和閉合狀態(tài),也對應(yīng)這些區(qū)域?qū)φ{(diào)控蛋白的可接近(從而進(jìn)一步結(jié)合)程度。所以,我們將這種狀態(tài)也稱為染色質(zhì)可接近性(chromatin accessibility)。 染色質(zhì)的開放性和可接近性,可以認(rèn)為是一個概念。下文如果我混用兩個名詞,大家不要感到意外。那些高可接近性的開放染色質(zhì)區(qū)通常位于啟動子區(qū)和增強(qiáng)子區(qū)。關(guān)于這兩個區(qū)域的特點(diǎn),我們下文會介紹。 大部分高等生物都有上千種轉(zhuǎn)錄因子(人類大概2000種),構(gòu)成了復(fù)雜的轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)。這大概是染色質(zhì)這片草原上,多樣性最高的“物種”了。但無論這個網(wǎng)絡(luò)多復(fù)雜,只有靶基因的啟動子開放,對應(yīng)的轉(zhuǎn)錄因子才能發(fā)揮它們的功能。 圖4 開放染色質(zhì)與關(guān)閉染色質(zhì)區(qū)對調(diào)控蛋白的親和力不同 既然特定區(qū)域(尤其啟動子區(qū))染色體開放與否直接關(guān)系到基因的轉(zhuǎn)錄激活與沉默,那么通過調(diào)控,改變特定區(qū)域的核小體狀態(tài)就非常重要了——這就是核小體重塑(nucleosome remodelling)。 核小體重塑包括核小體的移動(挪動核小體在染色體上的位置)或重新拆裝(將特定區(qū)域的核小體解離或重新合成安裝上)。這些過程都是通過特定的蛋白復(fù)合物來完成,從而保證特定的染色體區(qū)域可以在開啟和關(guān)閉之間切換。 圖5 核小體狀態(tài)是可改變的 核小體修飾——植被是否變化也與草的品種有關(guān) 核小體是否被重塑,也是很大程度由其自身的成分決定的。核小體成分的改變包含了組蛋白亞型和組蛋白修飾兩大因素。上文我們提到,雖然核小體是八聚物,由四大類組蛋白構(gòu)成。 但特定類型組蛋白,依然存在變異體(由不同基因編碼)。例如,組蛋白H2A和H3,分別存在變異體H2A.Z和H3.3。這兩種變異體構(gòu)成的核小體通常較為不穩(wěn)定,便于染色質(zhì)開放性的高低調(diào)控。 而在組蛋白內(nèi)部,也存在不同類型的化學(xué)修飾。比如,我們?nèi)绻fH3K4me3,意思就是說H3組蛋白的第3個賴氨酸(K)上有3個位點(diǎn)發(fā)生了甲基化。H3K27ac,意思就是說H3組蛋白的第27個賴氨酸(K)上發(fā)生了乙?;?。這些組蛋白的化學(xué)修飾,也會影響核小體的靜電荷,從而影響核小體與DNA,核小體與其他蛋白的結(jié)合能力。 DNA甲基化是另外一個我們所熟悉的表觀修飾形式。在高等生物里,我們談DNA甲基化,通常默認(rèn)是5mC甲基化這種類型。很顯然,DNA甲基化類似組蛋白修飾一樣,也會改變DNA的靜電荷,從而改變DNA分子與其他蛋白分子的結(jié)合能力。 雖然DNA甲基化可能直接與轉(zhuǎn)錄因子互作從而影響基因的轉(zhuǎn)錄,但更多情況下DNA甲基化是與組蛋白修飾配合,通過一套復(fù)雜的關(guān)系影響基因轉(zhuǎn)錄。在我們的omicshare課堂《DNA甲基化與多組學(xué)貫穿分析》中,我們也詳細(xì)討論兩者的潛在關(guān)系。 總之,DNA甲基化影響基因轉(zhuǎn)錄的方式非常復(fù)雜,不是簡單的正相關(guān)或負(fù)相關(guān)關(guān)系,而是受組蛋白修飾類型、所在的基因區(qū)等多因素的影響。 圖6 來自O(shè)S課堂《DNA甲基化與多組學(xué)貫穿分析》的截圖 課堂鏈接:http://www./class/home/index/series?id=12 啟動子和增強(qiáng)子——草原水草最豐美的地方 上文,我們已經(jīng)提到了啟動子(promoter)和增強(qiáng)子(enhancer)區(qū),是基因組中最常見的開放區(qū)。其中,啟動子區(qū)是大部分人熟悉的,就是位于基因上游轉(zhuǎn)錄起始位點(diǎn)(TSS)附近的一段調(diào)控基因起始轉(zhuǎn)錄的區(qū)域。 而增強(qiáng)子大家可能略微陌生一些,簡單說來就是離基因通常更遠(yuǎn),主要通過激活特定啟動子而起到調(diào)控作用的基因組元件。如圖7b,增強(qiáng)子可以通過被一系列(有轉(zhuǎn)錄激活能力的)調(diào)控蛋白結(jié)合而間接與下游啟動子結(jié)合,從而激活下游啟動子的轉(zhuǎn)錄活性。 簡單來說,啟動子是激活下游基因轉(zhuǎn)錄的元件,增強(qiáng)子是激活啟動子的元件。無論啟動子還是增強(qiáng)子要起作用,前提是該區(qū)域處于核小體開放狀態(tài),可以被其他調(diào)控蛋白接近并結(jié)合。 如何判斷一個區(qū)域是有活性的啟動子還是增強(qiáng)子呢?首先,其必須是該區(qū)域處于開放的狀態(tài)(后續(xù)我們會介紹染色體開放性檢測的方法);其次,啟動子一般在TSS區(qū)附近,而增強(qiáng)區(qū)則可能離TSS區(qū)較遠(yuǎn);再次,這些區(qū)域?qū)?yīng)特定的組蛋白或DNA甲基化修飾狀態(tài)。例如,增強(qiáng)子區(qū)常見的組蛋白修飾方式是:H3K4me1/2(單甲基化或二甲基化),H3k27ac,而啟動子區(qū)附近的組蛋白一般帶有H3k4me3修飾。 有這樣的一系列線索,我們就可以找到染色質(zhì)草原水草最豐美的地方——處于激活狀態(tài)的啟動子和增強(qiáng)子區(qū)。這些地方,就是草原上的生物—— 轉(zhuǎn)錄因子等各類調(diào)控蛋白最愛來的地方。以這些地方為線索,我們就能揭開在特定組織、細(xì)胞內(nèi)部,各類分子相互調(diào)控背后的核心秘密。 圖7 啟動子與增強(qiáng)子示意圖 轉(zhuǎn)錄因子(轉(zhuǎn)錄因子)——可以改變“草原“植被的物種 在非洲大草原上,動物們隨著旱季和雨季變化,逐水草而居,在自然環(huán)境面前更多是被動適應(yīng)。但在染色質(zhì)這個大草原上,轉(zhuǎn)錄因子們則要強(qiáng)大地多——它們還可以反向改變草原的植被。 因?yàn)檗D(zhuǎn)錄因子在結(jié)合DNA的同時,也會逆向影響染色質(zhì)的結(jié)構(gòu),導(dǎo)致局部基因組開放性的改變。對于轉(zhuǎn)錄活躍的基因(圖8a), 啟動子區(qū)通常處于開放狀態(tài),從而讓轉(zhuǎn)錄因子可以結(jié)合啟動子激活轉(zhuǎn)錄。對于暫時處于沉默狀態(tài)但可以被誘導(dǎo)激活的基因(圖8b),我們將會看到轉(zhuǎn)錄因子如何反向改變局部染色質(zhì)的結(jié)構(gòu)。這個過程有三個步驟: (1)雖然該基因的啟動子區(qū)處于關(guān)閉狀態(tài),但處于核小體間的DNA連接區(qū)(linker)處于弱可接近的狀態(tài)。這些區(qū)域如果存在轉(zhuǎn)錄因子結(jié)合位點(diǎn),那么一些轉(zhuǎn)錄因子就可以結(jié)合在這個區(qū)域。這些轉(zhuǎn)錄因子被稱為先導(dǎo)(Pioneering)轉(zhuǎn)錄因子。 (2)隨著先導(dǎo)轉(zhuǎn)錄因子的結(jié)合,會招募其他的核小體重塑和修飾復(fù)合物的結(jié)合,進(jìn)一步將周邊染色質(zhì)從閉合改變?yōu)殚_放狀態(tài)。 (3)隨著區(qū)域開放性的提高,原先與核小體纏繞的轉(zhuǎn)錄因子結(jié)合位點(diǎn)被暴露出來,讓繼發(fā)(Secondary)轉(zhuǎn)錄因子可以結(jié)合在這個區(qū)域,從而全面激活這個區(qū)域的轉(zhuǎn)錄。 在這里我們可以看到,轉(zhuǎn)錄因子有點(diǎn)類似人類。人類可以在一處地方開墾和定居,從而改變某個區(qū)域的植被和地貌。但如果因?yàn)閼?zhàn)爭或其他原因?qū)е戮用襁w走,那么人類定居點(diǎn)會重新轉(zhuǎn)入荒蕪狀態(tài)。轉(zhuǎn)錄因子與核小體也存在動態(tài)拉鋸的關(guān)系,從而使基因可誘導(dǎo)區(qū)的開放性處于動態(tài)變化過程。 圖8 轉(zhuǎn)錄因子會反向改變“水草”的分布。圖中DNA上的紅點(diǎn)是轉(zhuǎn)錄因子結(jié)合位點(diǎn)。 通過上面的文章,我們已經(jīng)看到了在染色質(zhì)這個大草原上,轉(zhuǎn)錄因子們作為生態(tài)鏈非常重要的一部分,與其他影響染色質(zhì)結(jié)構(gòu)的因素持續(xù)相互作用,從而調(diào)節(jié)著細(xì)胞內(nèi)基因的轉(zhuǎn)錄表達(dá)。但我們也看到了,這些因素間的兩兩互作(圖9左半部)構(gòu)成了一個非常繁雜的系統(tǒng)。 當(dāng)我們看到下游基因轉(zhuǎn)錄的變化,實(shí)際上是上游各種復(fù)雜因素共同作用的結(jié)果。轉(zhuǎn)錄組測序后,我們找不到頭緒,不知道導(dǎo)致這些變化的關(guān)鍵因素是什么,這是非常正常的困惑。因?yàn)槿鐖D9,這個調(diào)控如同一個杠桿,兩側(cè)的信息量都非常巨大。如果你從轉(zhuǎn)錄組直接切入尋找上游,意味著無數(shù)的可能。 以轉(zhuǎn)錄因子為例,人體內(nèi)的轉(zhuǎn)錄因子約有兩千種。那么,對一個轉(zhuǎn)錄組的差異表達(dá)數(shù)據(jù),我們應(yīng)該選擇哪個轉(zhuǎn)錄因子下手呢?轉(zhuǎn)錄因子CHIP-seq的實(shí)驗(yàn)難度這么大,我們怎么能夠保證一擊必中呢?(非模式物種,還面臨沒有抗體的問題。不過后續(xù)我們會介紹DAP-seq這個能繞過抗體制備的非模式物種“替代性CHIP-seq“的方法) 又比如,如果從DNA甲基化和組蛋白修飾入手,那更是一鍋復(fù)雜的亂燉(常見的組蛋白修飾就有很多種,DNA甲基化與組蛋白修飾又有復(fù)雜的互作關(guān)系)。 那么我們有更好的思路嗎? 要想在轉(zhuǎn)錄前調(diào)控的主戰(zhàn)場——染色質(zhì)這片草原上縱橫馳騁,意味著我們需要獵手一樣敏銳的嗅覺和正確的方法。如果你是國家地理的攝影師,編輯部老板正催著你下周交稿,你會怎么做? 還繼續(xù)開著悍馬漫無目的地在非洲大草原上馳騁嗎?那樣的話,你有大概率拍不到什么好片子。那應(yīng)該去哪里?當(dāng)然去水草最豐美的地方。原因有兩點(diǎn): (1)你可以最短時間得到有效的信息 在水源地,角馬蹬羚要來飲水,獵豹獅子要來狩獵,你可以在最短的時間內(nèi)獲知當(dāng)?shù)厣鷳B(tài)系統(tǒng)的關(guān)鍵信息(有多少物種,種群多大,誰是王者)。 (2)為下一步的深入追蹤提供可能 如果你不滿足于只看動物喝水,則可以在它們喝完水后繼續(xù)深入追蹤它們的族群生活。至于你希望拍攝獅群內(nèi)部的競爭合作關(guān)系,還是斑鬣狗特別的生殖方式,完全是你的選擇。 圖9 染色質(zhì)開放性的變化是轉(zhuǎn)錄組前調(diào)控的核心節(jié)點(diǎn) 同樣的,在染色質(zhì)這片草原上,也有一片水草豐美的地方,那就是染色質(zhì)可變開放區(qū)(通常是啟動子和增強(qiáng)子區(qū))。如果你是轉(zhuǎn)錄調(diào)控研究的”獵手”,很顯然你應(yīng)該拿上長槍短炮先蹲守在這些地方。原因同樣有兩點(diǎn): (1)你可以用最簡潔的方式,得到最有效的關(guān)鍵信息 無論最上游調(diào)控因子變化多么復(fù)雜,方式多么多樣,它們要影響基因轉(zhuǎn)錄,必須經(jīng)過染色質(zhì)開放區(qū)。因此,關(guān)注可變開放區(qū)可以讓你暫時化繁為簡,直接知曉哪些基因的調(diào)控區(qū)發(fā)生了開放性的變化,開放區(qū)有哪些轉(zhuǎn)錄因子結(jié)合位點(diǎn)。 (2)為下一步的深入追蹤提供可能 當(dāng)你抓住了關(guān)鍵可變開放區(qū)的基礎(chǔ)信息,下一步你大可以進(jìn)入上游,窺視在這個區(qū)域周邊生活的物種(轉(zhuǎn)錄因子)如何與影響染色質(zhì)“環(huán)境”的環(huán)境因子(組蛋白修飾、DNA甲基化等)斗智斗勇,更加深入系統(tǒng)地解析染色質(zhì)這片草原上發(fā)生著的故事,然后快樂地發(fā)高分paper。 圖10 基因組可接近性的常見高通量檢測方法 好了,說了這么多,大家可能會對基因組可接近性研究非常感興趣了。實(shí)際上,在這個領(lǐng)域已經(jīng)有非常成熟的可以進(jìn)行全基因組水平開放染色質(zhì)檢測的方法。例如,DNase-seq、MNase、ATAC-seq等。在周四的微信文章中,我們將繼續(xù)為你介紹這些基因組可接近性檢測方法的原理和區(qū)別。 另外,周四的微信文章中,我們將有一個驚喜公布給大家,敬請期待。 Tips: 對ATAC-seq感興趣的老師和同學(xué)可留言咨詢,基迪奧會為您量身定制專業(yè)的個性化實(shí)驗(yàn)分析方案。 參考文獻(xiàn): [1]Cedar H, Bergman Y. Linking DNA methylation and histonemodification: patterns and paradigms[J]. Nature Reviews Genetics, 2009, 10(5):295. [2] Bell O, Tiwari V K, Thom? N H, et al. Determinants anddynamics of genome accessibility[J]. Nature Reviews Genetics, 2011, 12(8): 554. [3] Ong C T, Corces V G. Enhancer function: newinsights into the regulation of tissue-specific gene expression[J]. NatureReviews Genetics, 2011, 12(4): 283. |
|