今天更新續(xù)文,上篇文章寫了生存曲線的畫法,但是留了一個(gè)問(wèn)題沒(méi)有解決,就是Kaplan-Meier生存曲線實(shí)際上僅僅把病人分為兩組做了生存率隨時(shí)間的比較,但是它并沒(méi)有考慮協(xié)變量。R數(shù)據(jù)分析:生存分析的做法和結(jié)果解釋 那么,我們做研究的時(shí)候,你發(fā)現(xiàn)了兩個(gè)組的生存情況不一樣,是不是下一步你就要想看看到底是那些因素影響了我們的生存情況。今天的文章就嘗試著解決這么樣問(wèn)題。 問(wèn)題描述我們今天要關(guān)注的問(wèn)題變了,我們會(huì)想要探討很多因素造成的病人生存情況的差異: 比如,我們今天想來(lái)探究一下究竟是哪些因素會(huì)影響結(jié)腸癌患者的生存情況,我們的備選因素有3個(gè),分別是性別sex,治療方法rx和癌腫附著情況adhere(是否附著到其他器官,2分類變量)。 那么數(shù)據(jù)集依然是survival包自帶的colon數(shù)據(jù)集。 對(duì)于我們的研究問(wèn)題,我可以很自然地想要做亞組分析,窮盡所有亞組來(lái)看差異,首先我們依然用Kaplan-Meier方法擬合生存曲線: require("survival") 輸出其實(shí)挺混亂的,我們依然可視化看看: ggsurv <- ggsurvplot(fit2, fun = "event", conf.int = TRUE, 通過(guò)亞組分析的結(jié)果我們可以知道男女的生存情況在所有情況下都有差異,但是局限性在于我們還是不能知道不同的治療方法或者癌腫附著是不是會(huì)影響病人的生存,因?yàn)槲覀兊膱D都是在分組展示不同性別的差異。 當(dāng)然了,你可以改公式自己再跑跑看,但這不是我們理想的方法。 風(fēng)險(xiǎn)比例模型
Cox回歸又稱為比例風(fēng)險(xiǎn)模型,Cox回歸比壽命表法和Kaplan-Meier法的應(yīng)用范圍更廣,它能夠同時(shí)考慮多個(gè)自變量對(duì)生存時(shí)間分布的影響。這個(gè)就是它最重要的優(yōu)點(diǎn)。 想理解這個(gè)模型,必須要理解風(fēng)險(xiǎn)函數(shù)(上篇文章有提)Cox風(fēng)險(xiǎn)比例模型的基本形式如下: 上面的式子,一句話就是:t時(shí)間的風(fēng)險(xiǎn)等于基線風(fēng)險(xiǎn)乘以所有預(yù)測(cè)變量造成的風(fēng)險(xiǎn)的指數(shù)冪。上面式子做一個(gè)簡(jiǎn)單的數(shù)學(xué)變換就可以得到以lnHR為因變量,自變量為研究變量的線性組合的形式: 那么,寫到這兒,大家肯定就知道了風(fēng)險(xiǎn)比例模型中自變量系數(shù)的解釋,就是自變量每改變一個(gè)單位,風(fēng)險(xiǎn)比的自然對(duì)數(shù)的改變量。 那么具體到我們的例子,我們可以做一個(gè)風(fēng)險(xiǎn)比例模型瞅瞅: fit.coxph <- coxph(Surv(time, status) ~ sex + rx + adhere, 從輸出結(jié)果看性別對(duì)死亡風(fēng)險(xiǎn)沒(méi)有顯著影響,圖中的兩種治療方案相對(duì)于參照組都可以降低死亡風(fēng)險(xiǎn),癌腫附著會(huì)增加死亡風(fēng)險(xiǎn)。 具體解釋為:相對(duì)于觀察組,施加rxlev治療和relev+5FU治療的病人發(fā)生結(jié)局(死亡)的風(fēng)險(xiǎn)會(huì)分別是基線風(fēng)險(xiǎn)的0.97和0.64,有癌腫附著的病人發(fā)生結(jié)局(死亡)的風(fēng)險(xiǎn)會(huì)是基線的1.34倍。 我們還可以畫出變量對(duì)死亡風(fēng)險(xiǎn)影響的森林圖: ggforest(fit.coxph, data = colon) 當(dāng)然了這個(gè)森林圖對(duì)我們這個(gè)例子并沒(méi)有啥用哈,僅供看官一樂(lè)。 小結(jié) |
|