午夜视频在线网站,日韩视频精品在线,中文字幕精品一区二区三区在线,在线播放精品,1024你懂我懂的旧版人,欧美日韩一级黄色片,一区二区三区在线观看视频

分享

利用NCBI學(xué)習(xí)生物信息學(xué)-winnieding's blog

 瓦娜兒 2010-12-06

winnieding's blog

  

利用NCBI學(xué)習(xí)生物信息學(xué)--------Map veiwer 該博文已被推薦

Map viewer提供基因組的遺傳圖譜,物理圖譜。不同的物種可查詢的圖譜是不同的,包括序列圖譜,細(xì)胞遺傳學(xué)圖譜,基因連鎖圖譜和雜交圖譜。具體如下(來自NCBI)

在使用map viewer時(shí)會(huì)遇到兩種圖,一種是整個(gè)genome view,一種是map view。前者以染色體的形式提供物種整個(gè)的基因組的圖像,后者只顯示單一的染色體或是染色體上的一部分,但是提供細(xì)節(jié)。
先看下genome view:
Genome view的目的是根據(jù)你查詢的結(jié)果提供基因組的整體形象,沒有太多細(xì)節(jié)顯示,提供與你查詢相關(guān)的結(jié)果,并且給出他們?cè)诨蚪M中的定位,根據(jù)這些你可以找到你想要找的基因。具體看下吧,我找人的p53基因,在map viewer的search中輸入相應(yīng)的查詢條件:
附:以下所列的都可以用來查詢
也可以用BLAST查詢。沒用過,希望園子里用過的戰(zhàn)友賜教。
居然有這么多和p53相關(guān)的基因,往下看這個(gè)網(wǎng)頁就給出了所有hits具體都是什么基因,看看下邊這一條一條的都是什么吧
Chr:染色體,下邊是1,代表1號(hào)染色體
Assembly:是來源,除了reference,還有來自celera公司和HuRef-Primary(注釋的人類基因組,誰能告訴我這個(gè)是什么?。┑慕Y(jié)果。
Match:是相關(guān)基因的名稱,種屬來源,按在基因上的定位分類
Map element type:顯示了最經(jīng)常使用的鑒定相關(guān)基因的序列(原文:In the center of the results table, MapViewer displays the commonly used identifier for each match (e.g. gene symbol, marker name). )大概這個(gè)意思吧,如果不對(duì)還希望大家能幫忙糾正。點(diǎn)擊可以看到詳細(xì)的信息。
Maps:相關(guān)基因的來源,感覺點(diǎn)開后的結(jié)果和上邊map element點(diǎn)開的結(jié)果差不多。
 
接下來精煉這么多結(jié)果,右邊有一個(gè)quick filter,選擇gene,只剩223個(gè)相關(guān)信息了,在頁面上的assembly中選擇reference(我們并不比較不同來源的p53有什么差異,所以選一個(gè)就可以了),on chromosome 中寫17,很容易找到需要的基因:
 點(diǎn)map element 或maps就可以看到詳細(xì)的信息了:
窗口master map下邊有兩個(gè)圖,左邊的是additional map,右邊的是master map,可以通過additional map上的藍(lán)色小箭頭把a(bǔ)dditional map變?yōu)閙aster map.
在最左邊有maps&options,這個(gè)很有用,點(diǎn)開
 
可以利用這個(gè)設(shè)置map viewer中顯示的圖像,信息。
Available maps:列出了可以顯示的圖像,我在里邊添加了CpG island
Move up,move down,make master/move to bottom這些按鈕可以選擇把那個(gè)圖像作為master map.
Chromosome 和region和shown可以改變這條染色體顯示的區(qū)域
Page length:例如這里是30,就說明在master map中顯示的染色體中不論有多少markers都只顯示30個(gè)。
Verbose mode和compress map控制是否在master map上顯示細(xì)節(jié),前者顯示后者不顯示。
 
文章一開始就說了一些物種能夠查詢到4種圖譜,每種怎么看呢:
 
1. sequence maps:顧名思義,序列圖譜直接給出相關(guān)序列的信息。有幾種不同的序列圖譜,一種是genbank map,顯示經(jīng)過同源比對(duì)的單一序列片段的DNA,這種圖譜常常用來鑒定DNA克隆中含有的部分基因組序列。另一種是contig map(重疊群圖譜)顯示連續(xù)的序列稱為contigs,是小序列的重疊序列。用這種圖譜得到長的連續(xù)的DNA序列。還有一種是最復(fù)雜的annotated map(注釋圖譜)或者是genes sequence map,顯示了特殊位點(diǎn)的序列相關(guān)特征,包括變異,STSs,預(yù)測的基因,基因模型,這種圖譜對(duì)于精確定位,DNA序列的特性等也是最有用的。還是以p53為例:
最左邊的是component map,由片段組成,每個(gè)片段在genbank都有對(duì)應(yīng)得信息,這里只有藍(lán)色的線,代表已經(jīng)完成的序列,如果有橘黃色的則代表draft。
中間的是contig map:由genbank中同源的重疊序列組成連續(xù)的大的“contig”,同樣橘黃色和藍(lán)色分別代表draft和finished
右邊的是sequence map:提供基因序列,基因來源和翻譯模式。藍(lán)色線代表基因序列和mRNA有很好的一致性,橘黃色則相反。
從這張圖上可以看到TP53兩側(cè)的基因是ATP1B2和LOC100506809,TP53這條基因序列的可信度非常高,因?yàn)樗莵碜詥我坏囊粭lGENBANK的序列(AC087388.9)
 
2. Cytogenic Maps:建立在染色體染色基礎(chǔ)上的,主要有ideogram(G帶圖)。這種圖對(duì)于研究染色體改變引起的生物表型和基因型的改變之間的聯(lián)系很有用,染色體的改變包括缺失,復(fù)制,轉(zhuǎn)位,插入等。例如我們都熟悉的21三體綜合癥。G帶圖一接觸遺傳就學(xué)了,所以忘得最快。從網(wǎng)上找了相關(guān)的內(nèi)容(http://boyun./bio/?p=1405):
什么是染色體G帶圖
將染色體經(jīng)過一定程序的處理,并用特定的染料染色后,使染色體在其長軸上顯示出一個(gè)個(gè)明暗交替或深淺不同的橫紋,這樣的橫紋就叫做染色體的帶。染色體G帶也稱為G顯帶,是最常用的染色體檢查方法,可以識(shí)別和分析每條染色體。
人類染色體G帶圖
在許多基因組圖譜中,染色體的G帶圖依然是染色體的表示,是染色體真實(shí)存在形態(tài)的一種描述。隨著基因組注釋的深入,基因組圖譜系統(tǒng)成為人們了解基因組的常用方法,像NCBI的mapviewer、EBI的Ensembl、GBrowse等。將序列對(duì)應(yīng)與G帶圖上,建立起核酸序列與染色體之間的聯(lián)系,對(duì)于人們深入的了解染色體具有重要的意義,如同建立起一級(jí)結(jié)構(gòu)與三級(jí)結(jié)構(gòu)的聯(lián)系。而G帶圖的數(shù)字化是關(guān)鍵步驟,如何將圖變?yōu)閿?shù)據(jù)庫描述的記錄,如果由數(shù)據(jù)庫還原為圖。本篇文章以NCBI的MapViewer為例,做一個(gè)介紹。
NCBI G帶圖(Ideogram)的保存格式:
  • chromosome
    arm
    band
    iscn_start
    iscn_stop
    bp_start
    bp_stop
    stain
    density bases
數(shù)據(jù)庫中字段的說明:
  • am表示染色體的臂, 每個(gè)染色體有兩個(gè)臂,am=q 或者am=p,am= cen表示兩個(gè)臂的焦點(diǎn)。如果為空表示只有一個(gè)臂
  •  band表示染色體上的條帶的編號(hào),分為4級(jí),比如染色體1的q臂分為3個(gè)區(qū)分別是1,2,3;1下面有分11,12,13;11下面又分為11.1,11.2,11.3;11.1下面又分為11.1a,11.1b,11.1c;
  •  iscn_start,iscn_stop表示條帶開始與結(jié)束的位置;
  •  bp_start,bp_stop表示對(duì)于的堿基
  •  density表示條帶的密度,其值分別為空,25,50,75,100
  •  stain=’acen’的band部分用斜杠圖形表示
  •  stain=’gvar’的band部分用反斜杠圖案表示
畫圖方法:
  •  按照iscn_start,iscn_stop的值,由上往下畫圖 如果有臂,則長臂短臂要分開顯示
  •  band的四級(jí)不顯示,如果只有2級(jí),則標(biāo)識(shí)2級(jí),否則僅僅顯示三級(jí)
  •  根據(jù)density的值,確定條帶的顏色,空為白色,100為黑色,其他顯示過度顏色
  • 圖上要標(biāo)識(shí)G帶的編號(hào),編號(hào)為chro+am+band 
背景知識(shí)
1968年,瑞典學(xué)者卡斯珀松( T.O.Caspersson,1910—)首次應(yīng)用熒光染料氮芥喹葉因處理染色體標(biāo)本,發(fā)現(xiàn)染色體因著色不同能夠沿其縱軸顯示出寬窄和亮度不同的熒光帶。這種明暗相間的帶紋被稱為Q帶。Q帶受制片過程和熱處理的影響較小,制片效果較好,帶型鮮明。但是,由于熒光持續(xù)存在的時(shí)間很短,必須立即進(jìn)行顯微攝影。另外,必須有熒光顯微鏡才能進(jìn)行觀察,所以,不能為一般實(shí)驗(yàn)室所采用。后來,研究者發(fā)現(xiàn)染色體標(biāo)本如果先經(jīng)過鹽、堿、熱、胰酶或蛋白酶、尿素及去垢劑等的處理后,再用一種叫做Giemsa的染液染色,也能使染色體沿其縱軸顯示出深淺相間的帶紋,這個(gè)帶紋稱為G帶。G帶在各條染色體上顯出的帶型和Q帶型基本相同。由于G帶染色沒有Q帶的缺點(diǎn),在普通顯微鏡下就可以進(jìn)行觀察,所以為一般實(shí)驗(yàn)室普遍采用。
 
Anopheles gambiae 的AGXH77為例:
Ideogram就不用說了
Sat_cyto全程microsatellite-cytogenetic:這個(gè)圖的組成是細(xì)胞遺傳圖用G帶對(duì)比已知的微衛(wèi)星序列。
 
3. Genetic linkage maps:遺傳連鎖圖譜,單位是厘摩(centimorgan,cM),這不是一個(gè)距離單位而是DN***段長度100次有絲分裂事件中有1次重組。所以對(duì)于物理圖譜來說這是一個(gè)相對(duì)距離,當(dāng)然連鎖的基因都在一條染色上。遺傳連鎖圖譜對(duì)于分析在同一連鎖(linkage group)中基因的遠(yuǎn)近和順序是非常有用的,但是單憑連鎖圖譜確定基因順序是不夠的還要結(jié)合物理圖譜。
 
4. radiation hybrid(RH) maps:(翻也翻不對(duì),所以不翻了) Radiation hybrid (RH) maps are very similar to genetic linkage maps in that they too are based on the frequency with which two markers are found in each other's presence; therefore, these maps show feature order and proximity. However, radiation hybrid maps are the result of induced DNA fragmentation and so can produce maps of higher resolution than standard genetic linkage maps. Basically, irradiation of the DNA donor cells fragments the DNA into small pieces which, upon somatic cell fusion, either form mini-chromosomes or integrate into the genomes of the recipient cells. The hybrid DNA can then be probed (by FISH or PCR) for the presence of select pairs of donor markers. Irradiation can be used to create very small fragments of DNA, producing very high resolution maps and providing a higher density of markers useful for positional cloning. Radiation hybrid maps have been generated for various types of markers including sequence tagged sites (STSs) and simple sequence length polymorphisms (SSLPs). Because of the high map resolution and marker density of RH maps, they are especially useful for positional cloning studies.
 
比如查Mus musculus的D2Mit472:
WT/MRC-RH:whitead-MRC RH mouse map
WT-YAC:whitehead mouse YAC map
WT-GEN:whitehead mouse genetic map
前兩個(gè)是RH圖,最后一個(gè)是遺傳連鎖圖,可以看到不同的圖譜給出的信息不同,即不同圖譜給出的D2Mit472兩側(cè)的基因不同,也反映了不同作圖方法給出的相關(guān)連鎖基因的位置,數(shù)量等的不同。
 
以上內(nèi)容來自NCBI
 

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多