午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

《自然》智能軟件解開(kāi)細(xì)胞中的基因調(diào)控

 干細(xì)胞與外泌體 2022-09-06 發(fā)布于廣東

在剖析細(xì)胞的調(diào)節(jié)電路如何連接時(shí),一些研究人員轉(zhuǎn)向他們的移液器。Emily Miraldi 博士轉(zhuǎn)向她的電腦鍵盤。

請(qǐng)關(guān)注“干細(xì)胞與外泌體”微信公眾號(hào),了解更多行業(yè)信息

作為俄亥俄州辛辛那提兒童醫(yī)院的計(jì)算和系統(tǒng)生物學(xué)家,Miraldi 使用數(shù)學(xué)來(lái)了解是什么讓細(xì)胞系統(tǒng)運(yùn)轉(zhuǎn),并預(yù)測(cè)它們對(duì)環(huán)境的反應(yīng)。作為博士后,她與紐約市紐約大學(xué)的計(jì)算生物學(xué)家 Richard Bonneau 和免疫學(xué)家 Dan Littman 合作。 

2006 年,Bonneau 和他的同事建立了一個(gè)名為 Inferelator的計(jì)算建模工具,該工具使用基因表達(dá)數(shù)據(jù)來(lái)推斷稱為轉(zhuǎn)錄因子的 DNA 結(jié)合蛋白如何控制特定基因的表達(dá)。研究人員可以使用生成的網(wǎng)絡(luò)圖來(lái)跟蹤通過(guò)細(xì)胞的信息流,識(shí)別——也許還有逆向工程——控制關(guān)鍵過(guò)程的監(jiān)管機(jī)構(gòu)。

大腸桿菌基因調(diào)控網(wǎng)絡(luò)的示意圖,顯示了控制基因表達(dá)的相互作用。

Equinox Graphics/SPL

但是推斷這些電路的結(jié)構(gòu)很復(fù)雜。即使是最簡(jiǎn)單的基因表達(dá)數(shù)據(jù)也可以用多種網(wǎng)絡(luò)架構(gòu)來(lái)解釋,而看似直接的交互可能并非如此。轉(zhuǎn)錄因子通常協(xié)同工作,被酶修飾,可以在遠(yuǎn)離其靶基因的數(shù)萬(wàn)或數(shù)十萬(wàn)個(gè) DNA 堿基處發(fā)揮作用。

盡管已在人類基因組中鑒定出約 1,600 種轉(zhuǎn)錄因子,但對(duì)于許多人來(lái)說(shuō),它們與 DNA 結(jié)合的確切序列(或“基序”)的信息仍然缺乏。此外,細(xì)胞中的基因組 DNA 與稱為染色質(zhì)的復(fù)合物中的蛋白質(zhì)包裝在一起,可以阻止轉(zhuǎn)錄因子結(jié)合。

為了解決其中一些問(wèn)題,Bonneau 的團(tuán)隊(duì)合并了另一種類型的實(shí)驗(yàn)數(shù)據(jù)來(lái)改進(jìn) Inferelator。他們使用來(lái)自一項(xiàng)技術(shù)的信息,該技術(shù)揭示了基因組中哪些染色質(zhì)區(qū)域未包裝并可用于轉(zhuǎn)錄因子結(jié)合。該方法被稱為 ATAC-seq——通過(guò)高通量測(cè)序檢測(cè)轉(zhuǎn)座酶可及的染色質(zhì)。通過(guò)重新配置軟件以使用這些數(shù)據(jù),該團(tuán)隊(duì)能夠確定哪些基因串聯(lián)改變了表達(dá),以及哪些轉(zhuǎn)錄因子 DNA 結(jié)合基序可用于影響該表達(dá)。

在加利福尼亞州南舊金山的基因泰克研究和早期開(kāi)發(fā)中心的 Bonneau 稱之為“絕技”研究中,Miraldi 和她的同事使用這個(gè)更新的推斷器來(lái)追蹤由一類白細(xì)胞中數(shù)千個(gè)轉(zhuǎn)錄因子組成的網(wǎng)絡(luò)稱為 17 型 T 輔助細(xì)胞。他們發(fā)現(xiàn)這些細(xì)胞中的轉(zhuǎn)錄因子 STAT3 和 FOXB1 是與炎癥性腸病有關(guān)的基因的關(guān)鍵調(diào)節(jié)因子。

“這篇論文是我們第一次能夠驗(yàn)證,如果你只從 RNA-seq 和 ATAC-seq [數(shù)據(jù)] 開(kāi)始,你可以獲得相對(duì)于單獨(dú)的基因表達(dá)數(shù)據(jù)更準(zhǔn)確的基因調(diào)控網(wǎng)絡(luò),”Miraldi說(shuō)。

今天,無(wú)論是在群體還是單個(gè)細(xì)胞的水平,Inferelator 只是用于基因調(diào)控網(wǎng)絡(luò) (GRN) 推理的快速增長(zhǎng)的軟件工具集合之一。這些可能僅依賴于基因表達(dá)數(shù)據(jù),但有些則利用其他數(shù)據(jù)類型或模擬監(jiān)管網(wǎng)絡(luò)的系統(tǒng)破壞。其他人正在幫助梳理出指導(dǎo)轉(zhuǎn)錄因子活性的序列。如果你想預(yù)測(cè)細(xì)胞的行為,Miraldi 說(shuō),“你需要了解它們是如何連接的”。

一個(gè)推理的問(wèn)題

研究人員可以通過(guò)實(shí)驗(yàn)梳理出監(jiān)管網(wǎng)絡(luò)。例如,使用染色質(zhì)免疫沉淀(使用抗體來(lái)識(shí)別轉(zhuǎn)錄因子與 DNA 結(jié)合的位置和時(shí)間)和基因表達(dá)分析等方法,研究人員可以將轉(zhuǎn)錄因子結(jié)合與基因表達(dá)相關(guān)聯(lián),并確定它們作用的 DNA 區(qū)域。

從那里,他們可以建立網(wǎng)絡(luò)來(lái)解釋數(shù)據(jù)。但是這些方法是勞動(dòng)密集型的,并且可能需要尚未制造或質(zhì)量差的抗體。他們傾向于一次只關(guān)注一種蛋白質(zhì)。并且在實(shí)驗(yàn)室中可能無(wú)法獲得或無(wú)法獲得感興趣的細(xì)胞類型。GRN 推理允許研究人員通過(guò)挖掘基因表達(dá)數(shù)據(jù)以計(jì)算推斷這些網(wǎng)絡(luò)來(lái)規(guī)避這些問(wèn)題。由此產(chǎn)生的網(wǎng)絡(luò)可以為實(shí)驗(yàn)設(shè)計(jì)提供信息,進(jìn)而可以改進(jìn)計(jì)算模型。

GRN 推斷的最簡(jiǎn)單方法依賴于相關(guān)性——基因?qū)Ρ磉_(dá)同步上升和下降的趨勢(shì)?!叭绻铱吹綇囊粋€(gè)細(xì)胞到另一個(gè)細(xì)胞,這兩個(gè)基因總是一起上下波動(dòng),它們總是相互關(guān)聯(lián)的,那么它們之間很有可能存在調(diào)節(jié)關(guān)系,”喬治亞研究所的計(jì)算科學(xué)家Zhang XiuWei說(shuō)。亞特蘭大的技術(shù),她建立了自己的 GRN 推理工具。

幫助開(kāi)發(fā)該工具的比利時(shí)魯汶天主教大學(xué) (KU Leuven) 的博士生 Seppe De Winter 說(shuō),另一個(gè)名為 SCENIC+ 的 GRN 推理工具利用了機(jī)器學(xué)習(xí)?;蛘撸芯咳藛T可以將 GRN 簡(jiǎn)化為數(shù)學(xué)方程。今年 1 月,時(shí)任北達(dá)科他大學(xué)計(jì)算科學(xué)研究生的喬安娜·漢茲利克(Joanna Handzlik)使用一種稱為基因電路的建模方法,一個(gè)耦合微分方程系統(tǒng),每個(gè)方程描述一個(gè)基因——來(lái)推斷調(diào)控十幾個(gè)轉(zhuǎn)錄因子和參與血細(xì)胞成熟的靶基因之間的關(guān)系。

由于此類模型的計(jì)算量很大,因此研究人員傾向于通過(guò)合并更少的蛋白質(zhì)或?qū)⑺鼈兒?jiǎn)化為布爾系統(tǒng)來(lái)簡(jiǎn)化它們,其中每個(gè)交互都是打開(kāi)或關(guān)閉的。相反,Handzlik 將計(jì)算能力投入到了這個(gè)問(wèn)題上。她在大學(xué)的高性能計(jì)算集群上并行運(yùn)行了 100 個(gè)計(jì)算機(jī)處理核心數(shù)天,解決了數(shù)千萬(wàn)次方程,直到她為她的模型得出一組反映實(shí)驗(yàn)數(shù)據(jù)的參數(shù)。然后,Handzlik 模擬了如果她消除或減少稱為 PU.1 和 GATA1 的兩種轉(zhuǎn)錄因子之一的表達(dá)會(huì)發(fā)生什么?!拔覀兛吹?,值得注意的是,該模型實(shí)際上與實(shí)驗(yàn)預(yù)期的結(jié)果一致,”她說(shuō)。

“啊哈”時(shí)刻

Aviv Regev 是單細(xì)胞生物學(xué)的先驅(qū),現(xiàn)在是基因泰克研究和早期開(kāi)發(fā)的執(zhí)行副總裁,她職業(yè)生涯的大部分時(shí)間都在追求 GRN。她說(shuō),促使她的團(tuán)隊(duì)設(shè)計(jì)更微妙的方法來(lái)處理和分析單細(xì)胞的動(dòng)機(jī)之一,“源于該主題對(duì)我的重要性”。

她說(shuō),假設(shè)你擾亂了細(xì)胞群中的一個(gè)基因。通過(guò)觀察哪些基因受到影響,您可以對(duì)調(diào)節(jié)回路進(jìn)行建模。但要證實(shí)你的假設(shè),你可能需要破壞數(shù)十甚至數(shù)百個(gè)其他基因。她說(shuō),這很快就變得不切實(shí)際了——但不是在單細(xì)胞水平上,每個(gè)細(xì)胞都是自己的數(shù)據(jù)集?!拔覀冋J(rèn)為在單細(xì)胞基因組學(xué)中,我們將能夠做一些我們根本無(wú)法批量做的事情?!?/p>

Regev 和她的團(tuán)隊(duì)?wèi)?yīng)用單細(xì)胞方法和新的計(jì)算方法來(lái)研究來(lái)自骨髓的 18 種特殊免疫細(xì)胞樣本(稱為樹(shù)突狀細(xì)胞)如何對(duì)細(xì)菌細(xì)胞壁的一種成分作出反應(yīng)。他們說(shuō),這 18 個(gè)細(xì)胞實(shí)際上代表了兩個(gè)群體。著眼于更大的亞群,他們發(fā)現(xiàn)雖然所有人都同時(shí)受到細(xì)菌分子的刺激,但并非所有人都以相同的程度做出反應(yīng)。利用細(xì)胞之間的細(xì)微差異,研究小組推斷出一個(gè)簡(jiǎn)單的相關(guān)電路,將轉(zhuǎn)錄因子 STAT2 和 IRF7 標(biāo)記為抗病毒活性的“主調(diào)節(jié)器”?!澳憧梢詮膯渭?xì)胞之間的這種變化中做很多事情,”她說(shuō)。

對(duì)于威斯康星大學(xué)麥迪遜分校的計(jì)算生物學(xué)家 Anthony Gitter 來(lái)說(shuō),Regev 的工作代表了一個(gè)“啊哈”的時(shí)刻。他發(fā)現(xiàn),通過(guò)檢查每個(gè)單細(xì)胞分布圖,尋找它們?cè)诩?xì)胞分化途徑中的相對(duì)位置的線索,可以按“偽時(shí)間”按時(shí)間順序組織它們。

“Pseudotime 允許您對(duì)單元格進(jìn)行排序,以便查看哪些原因先于影響,”Gitter 說(shuō)。它試圖“通過(guò)使用一個(gè)細(xì)胞相對(duì)于其他細(xì)胞的表達(dá)測(cè)量來(lái)估計(jì)每個(gè)細(xì)胞的時(shí)間點(diǎn)”。然后研究人員可以使用這些偽時(shí)間估計(jì)來(lái)構(gòu)建 GRN。

?CellOracle 軟件將改變細(xì)胞身份的基因調(diào)控網(wǎng)絡(luò)可視化。在自然狀態(tài)下(左圖),小鼠血細(xì)胞分化為紅細(xì)胞(左下)或白細(xì)胞(左上);右側(cè)面板顯示了刪除關(guān)鍵轉(zhuǎn)錄因子時(shí)的相同過(guò)程。圖片來(lái)源:Kenji Kamimoto/Samantha Morris Lab

Gitter 的團(tuán)隊(duì)基于這個(gè)想法創(chuàng)建了一個(gè)名為 SINGE 的工具,并將其應(yīng)用于小鼠胚胎干細(xì)胞發(fā)育成內(nèi)胚層細(xì)胞。它奏效了,但他說(shuō),結(jié)果并不令人印象深刻?!叭绻榭吹奈ㄒ粩?shù)據(jù)是基因表達(dá),那么您對(duì)基因調(diào)控的了解似乎仍然存在一些基本限制?!甭槭蚴泄鸫髮W(xué)和麻省理工學(xué)院基因調(diào)控觀察站聯(lián)合主任 Jason Buenrostro 說(shuō),問(wèn)題在于,僅靠基因表達(dá)數(shù)據(jù)并不能充分“限制”可以解釋數(shù)據(jù)的可能網(wǎng)絡(luò)的數(shù)量。例如,兩個(gè)相關(guān)基因可能受相同轉(zhuǎn)錄因子的調(diào)控,或者受第三種不同轉(zhuǎn)錄因子調(diào)控的兩個(gè)不同基因調(diào)控。?

在 2020 年的一項(xiàng)研究中,位于布萊克斯堡的弗吉尼亞理工大學(xué)的計(jì)算機(jī)科學(xué)家 T. M. Murali 和他的團(tuán)隊(duì)描述了一個(gè)名為 BEELINE 的計(jì)算管道,他們用它來(lái)測(cè)試十幾種基于單細(xì)胞 RNA 測(cè)序的 GRN 推理方法,對(duì)照金標(biāo)準(zhǔn)和合成數(shù)據(jù)集. “大多數(shù)方法在推理方面做得相對(duì)較差,”穆拉利說(shuō),至少在推斷交互作用時(shí)——表現(xiàn)得和隨機(jī)預(yù)測(cè)器差不多,他指出。他說(shuō),解決方案是包含額外的數(shù)據(jù)。?

例如,Buenrostro 的團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為 FigR 的計(jì)算框架。它使用來(lái)自單細(xì)胞 RNA 測(cè)序和 ATAC-seq 的數(shù)據(jù)將轉(zhuǎn)錄因子及其靶基因的表達(dá)與蛋白質(zhì)結(jié)合基序的鑒定和染色質(zhì)可及性數(shù)據(jù)相結(jié)合。“當(dāng)我們這樣做時(shí),我們開(kāi)始非常清楚地看到,許多與我們最喜歡的基因共同表達(dá)的轉(zhuǎn)錄因子實(shí)際上并沒(méi)有在我們最喜歡的基因上富集序列?!边@意味著轉(zhuǎn)錄因子無(wú)法結(jié)合和調(diào)節(jié)基因,因此“它們被從分析中刪除”,他說(shuō)。“我們還看到了許多富集的序列,但轉(zhuǎn)錄因子甚至沒(méi)有表達(dá)?!?span style="display: none;line-height: 0px;">?

最新版本的推斷器還利用了單細(xì)胞 ATAC-seq 數(shù)據(jù)。但它通過(guò)考慮轉(zhuǎn)錄因子活性進(jìn)一步限制了這些信息。

“從測(cè)序數(shù)據(jù)中觀察到轉(zhuǎn)錄因子的表達(dá)水平并不能表明它在做什么,”領(lǐng)導(dǎo)更新版本開(kāi)發(fā)的 Claudia Skok Gibbs 解釋說(shuō)。這是因?yàn)樗鼈冎械囊恍┡c合作伙伴一起行動(dòng),或者必須經(jīng)過(guò)化學(xué)修飾才能變得活躍?;蛘?,它們的綁定站點(diǎn)可能無(wú)法用于綁定。Inferelator 3.0 著眼于目標(biāo)基因的表達(dá)水平以及轉(zhuǎn)錄因子基序數(shù)據(jù)庫(kù)以及基因組中潛在結(jié)合位點(diǎn)的染色質(zhì)可及性。這意味著它可以確定哪些轉(zhuǎn)錄因子可用于刺激或抑制給定細(xì)胞類型中的靶基因。然后將這些活動(dòng)分?jǐn)?shù)插入三種網(wǎng)絡(luò)構(gòu)建算法之一。

但對(duì)于計(jì)算模型,它們包含的變量越多越好,Bonneau 說(shuō)。在許多情況下,性能提升歸結(jié)為噪音。他說(shuō),為了平衡這些競(jìng)爭(zhēng)力量,該軟件對(duì)模型中的每種蛋白質(zhì)都進(jìn)行了“懲罰”——除非該蛋白質(zhì)似乎對(duì)感興趣的基因有活性。“如果該轉(zhuǎn)錄因子在該靶基因附近有一個(gè)結(jié)合位點(diǎn),該位點(diǎn)在該細(xì)胞類型的 ATAC-seq 數(shù)據(jù)中也顯示為開(kāi)放的,我們說(shuō)它不必付出如此大的代價(jià)?!?/p>

Skok Gibbs 使用 Inferelator 3.0 來(lái)識(shí)別果蠅中稱為跨髓神經(jīng)元的腦細(xì)胞中的調(diào)節(jié)劑。這些神經(jīng)元有多種形

式,可以通過(guò)改變單個(gè)基因的表達(dá)將一種形式轉(zhuǎn)換為另一種形式?!拔夷軌蜃C明我可以找到特定的轉(zhuǎn)錄因子以及它所針對(duì)的基因是造成這種情況的原因,”她說(shuō)。

遺傳變異數(shù)據(jù)也可以為 GRN 推斷提供信息。在過(guò)去十年中,位于馬薩諸塞州波士頓的哈佛 T. H. Chan 公共衛(wèi)生學(xué)院的網(wǎng)絡(luò)生物學(xué)家 John Quackenbush 和他的團(tuán)隊(duì)創(chuàng)建了一個(gè)由 PANDA、LIONESS 和 CONDOR 等名稱組成的虛擬算法“動(dòng)物園”。這些方法利用一種稱為消息傳遞的機(jī)器學(xué)習(xí)策略,以及轉(zhuǎn)錄因子在基因組中結(jié)合位置的知識(shí),來(lái)猜測(cè)并優(yōu)化 GRN。該團(tuán)隊(duì)最近的迭代,EGRET,使用遺傳變異信息為特定的個(gè)體和細(xì)胞類型定制 GRN。它基本上是通過(guò)考慮稱為多態(tài)性的序列變異如何影響轉(zhuǎn)錄因子結(jié)合來(lái)實(shí)現(xiàn)的。

由此產(chǎn)生的網(wǎng)絡(luò)可以揭示基因組非編碼部分的變異如何導(dǎo)致疾病。在對(duì)西非約魯巴人后裔的 119 名個(gè)體進(jìn)行的分析中,Quackenbush 和他的同事表明,與冠狀動(dòng)脈疾病相關(guān)的多態(tài)性主要影響心臟細(xì)胞中的 GRN,而與自身免疫性疾病相關(guān)的多態(tài)性則影響免疫細(xì)胞 。研究合著者 Deborah Weighill 說(shuō):“在我們觀察到的最相關(guān)的細(xì)胞類型中,我們看到了疾病相關(guān)轉(zhuǎn)錄因子基因調(diào)控的預(yù)測(cè)中斷?!?/p>

Nature 609, 428-431 (2022)

doi: https:///10.1038/d41586-022-02826-1

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多