(1)差異基因分析: 選用來(lái)自不同生理或病理狀態(tài)組織/細(xì)胞的樣本為研究對(duì)象,通過(guò)分析各樣本基因表達(dá)情況,進(jìn)行表達(dá)差異分析,從而篩選出與其狀態(tài)相關(guān)的候選基因。 (2)差異基因富集分析: 對(duì)篩選到的差異基因進(jìn)行功能富集分析(GO,KEGG 富集分析),進(jìn)一步全面地挖掘與樣本性狀相關(guān)的分子機(jī)制。 (3)分子標(biāo)記開(kāi)發(fā): 通過(guò)轉(zhuǎn)錄組測(cè)序進(jìn)行SNP、SSR 等分析,能夠更加全面高效地挖掘樣本的分子標(biāo)記。該分析廣泛應(yīng)用于遺傳育種、基因定位、物種親緣關(guān)系鑒別、基因庫(kù)構(gòu)建、基因克隆等方面。 (4)模式生物轉(zhuǎn)錄本深入研究: 對(duì)已有參考基因組的模式生物,轉(zhuǎn)錄組測(cè)序可以更加深入地分析其基因結(jié)構(gòu)相關(guān)信息,包括分析可變剪切、基因融合、新轉(zhuǎn)錄本的預(yù)測(cè)和注釋、lncRNA 的預(yù)測(cè)等。 (1)組織樣品 動(dòng)物組織:> 2g;植物組織:> 4g;培養(yǎng)細(xì)胞:> 1×107 個(gè);血液樣品:≥ 2ml(最好是全血) (2)真核生物RNA 請(qǐng)?zhí)峁舛取?200ng/μL,總量≥10μg 的RNA(單次建庫(kù)用量為5μg); OD260/280介于1.8~2.2 之間,OD260/230≥2.0,RIN≥6.5,28S:18S ≥1.0,確保RNA 無(wú)降解; 送樣時(shí)請(qǐng)標(biāo)記清楚樣品編號(hào),管口使用Parafilm 膜密封; 樣品保存期間切忌反復(fù)凍融;送樣時(shí)請(qǐng)使用干冰運(yùn)輸。 (3)原核生物RNA 請(qǐng)?zhí)峁舛取?00ng/μL,總量≥10μg 的RNA(單次建庫(kù)用量為5μg); OD260/280 介于1.8~2.2 之間,OD260/230≥2.0,RIN≥6.5,23S:16S ≥1.0,確保RNA 無(wú)降解; 送樣時(shí)請(qǐng)標(biāo)記清楚樣品編號(hào),管口使用Parafilm 膜密封; 樣品保存期間切忌反復(fù)凍融;送樣時(shí)請(qǐng)使用干冰運(yùn)輸。 轉(zhuǎn)錄組測(cè)序所需的測(cè)序量隨物種轉(zhuǎn)錄組大小的不同而有所差異。而轉(zhuǎn)錄組的大小受基因數(shù)目和豐度雙重影響,不同物種間變化很大。因此在測(cè)序之前,需要對(duì)轉(zhuǎn)錄組的大小進(jìn)行評(píng)估。 ①針對(duì)有參考基因組的物種,可通過(guò)分析基因組信息,統(tǒng)計(jì)編碼基因個(gè)數(shù)及其堿基數(shù)來(lái)評(píng)估轉(zhuǎn)錄組的大小,同時(shí)也可參考相近或相關(guān)物種轉(zhuǎn)錄組研究的文章; ②針對(duì)無(wú)參考基因組的物種,只能參考相近物種的轉(zhuǎn)錄組大小。 (1)RNA的降解會(huì)嚴(yán)重影響測(cè)序的質(zhì)量:①若RNA 的3'端發(fā)生降解,則無(wú)法通過(guò)3'端的poly A 捕獲mRNA,反轉(zhuǎn)錄后進(jìn)行測(cè)序也無(wú)法得到全部的cDNA②若RNA 的5'端發(fā)生降解,通過(guò)3'端的poly A 捕獲得到mRNA,測(cè)序結(jié)果將出現(xiàn)明顯的3’和5’偏向。 (2)RNA起始量不足影響測(cè)序的質(zhì)量:RNA 起始量不足時(shí),需要增加PCR 擴(kuò)增循環(huán)數(shù)才能獲得足夠的量用于后續(xù)測(cè)序,這會(huì)產(chǎn)生大量的冗余數(shù)據(jù)。 (3)文庫(kù)中poly A多聚物的存在會(huì)對(duì)測(cè)序信號(hào)產(chǎn)生干擾,影響測(cè)序結(jié)果的準(zhǔn)確性。 (4)由于轉(zhuǎn)錄組中基因的豐度不一致,高豐度的表達(dá)基因會(huì)掩蓋低豐度的表達(dá)基因,導(dǎo)致尋找新基因失敗或產(chǎn)生大量冗余數(shù)據(jù)。 根據(jù)研究物種的拉丁文名,可在Ensembl(http://asia./index.html)、JGI (http://genome./)和 NCBI (http://www.ncbi.nlm./)中搜索是否有該物種的基因組信息,也可在其他專(zhuān)門(mén)介紹某種物種的網(wǎng)站尋找參考基因組。 一般下載的文件包括:Assembled scaffolds (masked)、Genes 、Functional Annotations 三種文件;需要下載的文件具體如下: (1)序列信息:.fasta 文件,用于進(jìn)行mapping 比對(duì)。 (2)基因注釋信息:.gff 文件,里面包含基因名字,基因所在位置等信息,用于進(jìn)行測(cè)得序列的基因注釋?zhuān)⑨屗没蚩梢赃M(jìn)行下一步表達(dá)差異分析。 (3)GO 注釋信息:.txt 文件,里面包含基因名字和對(duì)應(yīng)注釋信息編號(hào)(GO 號(hào)),有此信息可以不用再重新進(jìn)行GO 注釋?zhuān)苯永么诵畔⑦M(jìn)行GO 富集分析。 差異基因的篩選是基于統(tǒng)計(jì)學(xué)意義的,不能僅僅通過(guò)一個(gè)基因在兩個(gè)樣本中表達(dá)量數(shù)值的大小判斷差異表達(dá)是否顯著。差異顯著情況可通過(guò)矯正后的p-value來(lái)看,矯正后的p-value越小,差異越顯著。同時(shí)也可結(jié)合|log2Foldchange|值來(lái)判斷差異的大小情況,|log2Foldchange|越大,差異倍數(shù)越大。 (1)實(shí)驗(yàn)樣本搞反導(dǎo)致的結(jié)果; (2)沒(méi)有使用與RNA-seq同一批樣本進(jìn)行驗(yàn)證; (3)挑選的基因表達(dá)差異并不顯著,或者挑選的是差異基因但表達(dá)量較低; (4)兩種方法本身就不同,RNA-seq是大規(guī)模篩選用的,反應(yīng)樣本整體的基因表達(dá)變化趨勢(shì),但不能保證每個(gè)基因的變化趨勢(shì)都與qPCR一致。存在一定量的不一致情況也屬正常。 |
|