在SAM輸出的結(jié)果中每一行都包括十二項(xiàng)通過(guò)Tab分隔,從左到右分別是: 1 序列的名字 2 概括出一個(gè)合適的標(biāo)記,各個(gè)數(shù)字分別代表
假如說(shuō)標(biāo)記為以上列舉出的數(shù)目,就可以直接推斷出匹配的情況。假如說(shuō)標(biāo)記不是以上列舉出的數(shù)字,比如說(shuō)83=(64+16+2+1),就是這幾種情況值和。 3 參考序列的名字 4 在參考序列上的位置 5 mapping qulity 越高則位點(diǎn)越獨(dú)特 bowtie2有時(shí)并不能完全確定一個(gè)短的序列來(lái)自與參考序列的那個(gè)位置,特別是對(duì)于那些比較簡(jiǎn)單的序列。但是bowtie2會(huì)給出一個(gè)值來(lái)顯示出 這個(gè)段序列來(lái)自某個(gè)位點(diǎn)的概率值,這個(gè)值就是mapping qulity。Mapping qulity的計(jì)算方法是:Q=-10log10p,Q是一個(gè)非負(fù)值,p是這個(gè)序列不來(lái)自這個(gè)位點(diǎn)的估計(jì)值。 假如說(shuō)一條序列在某個(gè)參考序列上找到了兩個(gè)位點(diǎn),但是其中一個(gè)位點(diǎn)的Q明顯大于另一個(gè)位點(diǎn)的Q值,這條序列來(lái)源于前一個(gè)位點(diǎn)的可能性就比較大。Q值的差距越大,這獨(dú)特性越高。 Q值的計(jì)算方法來(lái)自與SAM標(biāo)準(zhǔn)格式,請(qǐng)查看SAM總結(jié)。 6 代表比對(duì)結(jié)果的CIGAR字符串,如37M1D2M1I,這段字符的意思是37個(gè)匹配,1個(gè)參考序列上的刪除,2個(gè)匹配,1個(gè)參考序列上的插入。M代表的是alignment match(可以是錯(cuò)配) 7 mate 序列所在參考序列的名稱 8 mate 序列在參考序列上的位置 9 估計(jì)出的片段的長(zhǎng)度,當(dāng)mate 序列位于本序列上游時(shí)該值為負(fù)值。 10 read的序列 11 ASCII碼格式的序列質(zhì)量 12 可選的區(qū)域
|
|