組織器官是由眾多細(xì)胞類型組成,這些類型的細(xì)胞大小形態(tài)、基因表達(dá)、空間位置都各不相同,但相互之間時(shí)刻都進(jìn)行著緊密的細(xì)胞通訊,且與發(fā)揮的功能密不可分。單細(xì)胞轉(zhuǎn)錄組測序技術(shù)(scRNA-seq)的出現(xiàn),使我們可以精準(zhǔn)的識(shí)別每種細(xì)胞亞型、每個(gè)細(xì)胞的基因表達(dá)情況,但是缺少空間位置信息。而空間轉(zhuǎn)錄組測序技術(shù)(ST RNA-seq)可以同時(shí)提供空間位置信息和基因表達(dá)信息,但目前的檢測精準(zhǔn)度還達(dá)不到單細(xì)胞水平。 于是衍生出一個(gè)熱門的研究方向:單細(xì)胞與空間轉(zhuǎn)錄組聯(lián)合分析,實(shí)現(xiàn)“1+1>2”的效果。那么本期文章討論二者應(yīng)該如何聯(lián)合呢? 聯(lián)合之后又能解決什么問題?敬請期待下期文章! 單細(xì)胞與空間轉(zhuǎn)錄組數(shù)據(jù)聯(lián)合方式 單細(xì)胞和空間轉(zhuǎn)錄組數(shù)據(jù)聯(lián)合分析將有助于理解細(xì)胞類型分布的結(jié)構(gòu)以及構(gòu)成這種結(jié)構(gòu)的細(xì)胞間通訊。目前已經(jīng)發(fā)表的兩種數(shù)據(jù)聯(lián)合算法有很多,根據(jù)數(shù)據(jù)聯(lián)合策略的不同可以將這些算法分為兩種主要的方式:去卷積(Deconvolution)和映射(Mapping)。 去卷積 去卷積旨在根據(jù)單細(xì)胞數(shù)據(jù),從每個(gè)捕獲點(diǎn)(spot)mRNA轉(zhuǎn)錄物的混合物中分離出離散的細(xì)胞亞群。其輸入是單細(xì)胞數(shù)據(jù)和空間轉(zhuǎn)錄組數(shù)據(jù),輸出是每個(gè)spot點(diǎn)內(nèi)不同細(xì)胞類型所占的比例及每類細(xì)胞個(gè)數(shù),該類方法包括:SPOTlight、cell2location、MIA、stereoscope、SpatialDWLS及Robust cell-type decomposition(RCTD)。 映射 映射的基本思路是以單細(xì)胞分辨率創(chuàng)建空間分辨率的細(xì)胞類型映射,主要見于單細(xì)胞轉(zhuǎn)錄組與基于原位技術(shù)的空間轉(zhuǎn)錄組(High-plex RNA imaging,HPRI)聯(lián)合分析。映射分析是對探針得出的某部分組織的轉(zhuǎn)錄本數(shù)據(jù)和單細(xì)胞數(shù)據(jù)進(jìn)行共聚類或最近鄰回歸,得到某個(gè)區(qū)域中最可能的細(xì)胞類型或不同細(xì)胞類型的概率餅圖,該類方法包括pciSeq,Harmony,LIGER,Seurat等。 反卷積和映射這兩種方法之間,并不存在清晰的分界線。前者關(guān)注每個(gè)空間中spot點(diǎn)的情況,后者則是全局的進(jìn)行分析。從使用的統(tǒng)計(jì)模型,可以將單細(xì)胞和空間轉(zhuǎn)錄組整合的方法分為以下四種,分別是基于回歸的、基于概率模型的、通過相對聚集程度計(jì)算得分的和基于后聚類的方法,每種方法越來越倚重整個(gè)切片的全局信息,而不是對每個(gè)spot進(jìn)行獨(dú)立地判定。 表1 單細(xì)胞與空間轉(zhuǎn)錄組數(shù)據(jù)聯(lián)合方式匯總 1、多模式相交分析(MIA) 多模式相交分析(MIA)的方法計(jì)算了空間轉(zhuǎn)錄組的區(qū)域差異基因與單細(xì)胞轉(zhuǎn)錄組鑒定的細(xì)胞類型的marker基因之間的重疊關(guān)系,使用超幾何分布推斷特定組織區(qū)域中特定細(xì)胞類型的富集程度,以所有基因?yàn)楸尘坝?jì)算P值來表示。 原理:Background為單細(xì)胞與ST數(shù)據(jù)共同表達(dá)的基因集,找到單細(xì)胞數(shù)據(jù)中的CellMarkers基因集和非maker基因集,然后將ST的SpotMarkers分別與這兩個(gè)區(qū)域取交集,如果SpotMarkers多集中于藍(lán)色區(qū)域,則認(rèn)為CellMarkers與SpotMarkers是顯著重疊的,即推斷出SpotCluster屬于這個(gè)細(xì)胞類型的可能性越高。 簡單的來說就是,看一個(gè)spot點(diǎn)高表達(dá)的基因和某一細(xì)胞類型高表達(dá)的基因是否有足夠多的重疊,重疊的多的就認(rèn)為該區(qū)域?yàn)檫@一細(xì)胞類型。 2、SPOTlight SPOTlight是一種基于種子的非負(fù)矩陣因子分解回歸算法的反卷積算法。最初該算法是專門為空間數(shù)據(jù)開發(fā)的,經(jīng)過優(yōu)化后SPOTlight能夠?qū)⒖臻g與單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)集成在一起,從而推斷出每個(gè)spot中的細(xì)胞類型和比例。 應(yīng)用場景:Spatial decomposition(空間分解) 算法:Seeded NMF regression(基于種子的非負(fù)矩陣因子分解回歸) 優(yōu)點(diǎn):跨多個(gè)組織的高精度 缺點(diǎn):沒有將捕獲的位置信息合并到模型空間分解中 原理:SPOTlight新添加了先驗(yàn)信息,用細(xì)胞類型標(biāo)記基因初始化基準(zhǔn)矩陣和系數(shù)矩陣,從而大大提高了靈敏度和準(zhǔn)確性。同時(shí),依賴于非負(fù)最小二乘(NNLS)來填充捕獲位置的系數(shù)矩陣以及確定spot點(diǎn)的細(xì)胞組成。隨后解卷積空間捕獲的位置信息。 3、Stereoscope 該模型框架利用單細(xì)胞數(shù)據(jù)推斷空間數(shù)據(jù)中每個(gè)捕獲位置的每個(gè)細(xì)胞類型的比例估計(jì),從而消除了對空間數(shù)據(jù)分析時(shí)對要素或簇等抽象實(shí)體的任何解釋或注釋的必要性。 應(yīng)用場景:Spatial decomposition(空間分解) 算法:Negative binomial distribution with MAP(具有最大后驗(yàn)概率的負(fù)二項(xiàng)分布) 優(yōu)點(diǎn):利用完整的表達(dá)譜而不是選定的標(biāo)記基因來實(shí)現(xiàn)更高的準(zhǔn)確性 缺點(diǎn):需要更深的測序深度 原理:首先使用單細(xì)胞數(shù)據(jù)來描述每個(gè)細(xì)胞類型的表達(dá)譜,然后在每個(gè)捕獲位置內(nèi)找到這些類型的組合,以最好地解釋空間數(shù)據(jù) 4、cell2location cell2location是一種基于分層貝葉斯框架開發(fā)的,用于解析空間轉(zhuǎn)錄組數(shù)據(jù)中細(xì)粒度細(xì)胞類型,并創(chuàng)建不同組織的綜合細(xì)胞圖。 應(yīng)用場景:1. Spatial location reconstruction for scRNA-seq data(scRNA-seq數(shù)據(jù)的空間位置重建);2. Spatial decomposition(空間分解) 算法:Hierarchical Bayesian framework(層次貝葉斯框架) 優(yōu)點(diǎn):能夠推斷每個(gè)捕獲位置每種細(xì)胞類型的細(xì)胞絕對數(shù)量 缺點(diǎn):用戶通常不知道要預(yù)先指定的超參數(shù) 原理:首先,從scRNA-seq數(shù)據(jù)中提取參考細(xì)胞類型的特征信息,然后利用這些特征信息和一個(gè)或多個(gè)空間轉(zhuǎn)錄組數(shù)據(jù)集作為輸入,將單個(gè)spot點(diǎn)的mRNA信息分解為不同的參考細(xì)胞類型。 參考文獻(xiàn) [1] Longo SK, Guo MG, Ji AL, Khavari PA. Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics. Nat Rev Genet. 2021 Oct;22(10):627-644. [2] Moncada R, Barkley D, Wagner F, Chiodin M, Devlin JC, Baron M, Hajdu CH, Simeone DM, Yanai I. Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas. Nat Biotechnol. 2020 Mar;38(3):333-342. [3] Elosua-Bayes M, Nieto P, Mereu E, Gut I, Heyn H. SPOTlight: seeded NMF regression to deconvolute spatial transcriptomics spots with single-cell transcriptomes. Nucleic Acids Res. 2021 May 21;49(9):e50. [4] Andersson A, Bergenstr?hle J, Asp M, Bergenstr?hle L, Jurek A, Fernández Navarro J, Lundeberg J. Single-cell and spatial transcriptomics enables probabilistic inference of cell type topography. Commun Biol. 2020 Oct 9;3(1):565. [5] Kleshchevnikov V, Shmatko A, Dann E, Aivazidis A, King HW, Li T, Elmentaite R, Lomakin A, Kedlian V, Gayoso A, Jain MS, Park JS, Ramona L, Tuck E, Arutyunyan A, Vento-Tormo R, Gerstung M, James L, Stegle O, Bayraktar OA. Cell2location maps fine-grained cell types in spatial transcriptomics. Nat Biotechnol. 2022 May;40(5):661-671. |
|