《應(yīng)用統(tǒng)計(jì)學(xué)》 01 相關(guān)性比較??根據(jù)數(shù)據(jù)類型!! 數(shù)值數(shù)據(jù)與數(shù)值數(shù)據(jù)——相關(guān)系數(shù)數(shù)值數(shù)據(jù)與分類數(shù)據(jù)——相關(guān)比分類數(shù)據(jù)與分類數(shù)據(jù)——克萊姆相關(guān)系數(shù)——獨(dú)立性檢驗(yàn)(卡方檢驗(yàn))——畫表格求卡方值,然后根據(jù)獨(dú)立性檢驗(yàn),作出檢驗(yàn)假設(shè)證明是否具有相關(guān)性。 02 數(shù)據(jù)有兩大類 連續(xù)變量(正態(tài)或非正態(tài))、分類變量(二分類或多分類)。連續(xù)變量中,正態(tài)與非正態(tài)數(shù)據(jù)表示方法是不一樣的。正態(tài)數(shù)據(jù)一般用均數(shù)“土”標(biāo)準(zhǔn)差(x±s) 方式表示,其數(shù)據(jù)95.45%處于x±s 范闈內(nèi);非正態(tài)數(shù)據(jù)用中位數(shù)和四分位間距表示;分類變量表示方法更直接,通常為頻率與百分?jǐn)?shù)。 03 比較單個(gè)結(jié)局和單個(gè)變量 最常見的情況就是比較兩種處理的結(jié)果有何差異 。如比較兩組獨(dú)立的結(jié)果,正態(tài)分布應(yīng)選用t檢驗(yàn);連續(xù)非正態(tài)分布選用Mann-Whitney或Wilcoxon秩和檢驗(yàn);分類變量選用卡方檢驗(yàn),當(dāng)數(shù)據(jù)量很小時(shí),應(yīng)用Fisher檢驗(yàn)。 p為0.05的意義是:若不斷重復(fù)檢驗(yàn),差異由偶然導(dǎo)致的概率為5%。04 趨勢檢驗(yàn) 比較單個(gè)結(jié)局和多個(gè)變量,很多情況下,結(jié)局受多個(gè)變量影響,回歸分析適用于這種情況。 其中包括線性(liner)回歸,可應(yīng)用于連續(xù)正態(tài)分布的結(jié)局,如血鉀。二分類結(jié)局可應(yīng)用邏輯(logistic)回歸,其分析結(jié)果用比值比表示,即事件發(fā)生的比值與不發(fā)生比值的比值。比值比常被誤解為相對(duì)風(fēng)險(xiǎn)。同樣需要對(duì)不同的結(jié)局類型采用相應(yīng)的回歸分析。一個(gè)常犯的錯(cuò)誤是將連續(xù)變量轉(zhuǎn)為二分類,本應(yīng)使用線性回歸,最后使用了logistic回歸 。 以上均是一種結(jié)局(單個(gè)或多個(gè)自變)情況,沒有考慮時(shí)間或丟失數(shù)據(jù)的因素,不能用于生存分析。對(duì)于生存分析,應(yīng)用Cox比例風(fēng)險(xiǎn)回歸。計(jì)算得出風(fēng)險(xiǎn)比,表示死亡的相對(duì)風(fēng)險(xiǎn) 。 等級(jí)資料用spearman相關(guān)性分析 (見下表) 軟件要求作者選擇是否配對(duì)(Paired和Unpaired), 并決定選擇參數(shù)檢驗(yàn)還是非參數(shù)檢驗(yàn)。所謂參數(shù)檢驗(yàn)就是指配對(duì)t檢驗(yàn)或獨(dú)立樣本t檢驗(yàn),而非參數(shù)檢驗(yàn)則是指Mann-Whitney U檢驗(yàn)或配對(duì)Wilcoxon檢驗(yàn)。如果選擇參數(shù)檢驗(yàn)(默認(rèn)兩組數(shù)據(jù)均 呈正態(tài)分布),軟件會(huì)讓操作者選擇方差是否齊。如果方差齊,軟件會(huì)選擇t檢驗(yàn),如果不齊,軟件推薦Welch法。需要說明的一點(diǎn)是,如果兩組數(shù)據(jù)均呈正態(tài)分布,但方差不齊,此時(shí)應(yīng)采用校正t檢驗(yàn),目前有3種主要的校正t檢驗(yàn)法:Cochran & Cox法、 Satterthwait法和Welch法。Graph Pad Prism僅支持Welch法。如果兩組數(shù)據(jù)不呈正態(tài)分布,則應(yīng)該選用非參數(shù)檢驗(yàn)。非參數(shù)的兩個(gè)選項(xiàng)分別是Mann-Whitney U檢驗(yàn)和Kolmogorov-Smirnov檢驗(yàn)。一般選擇Mann-WhitneyU檢驗(yàn)。 參數(shù)分析結(jié)果的解讀與此類似,只不過多了個(gè) ' F test to compare varian ces' , 即方差是否齊 。一 般認(rèn)為, p值 > 0.10才可以認(rèn)為兩組數(shù)據(jù)方差 相同(注意 :是大于 , 不是小于 !是0. 10 , 不是0.05 ! ) 。 05 如何判斷數(shù)據(jù)是否成正態(tài)分布? GraphPad Prism提供了3種檢驗(yàn)數(shù)據(jù)是否呈正態(tài)分布的方法:D'Agootino-Pearson法,Kolmogorov-Smirnov法和Shapiro-Wilk法。針對(duì)同一種數(shù)據(jù),3種方法的計(jì)算結(jié)果大同小異。雖然GraphPad Prism不推薦用。 Kolmogorov-Smirnov法,但根據(jù)筆者經(jīng)驗(yàn),在國際上發(fā)表論文時(shí),多采用Kolmogorov-Smirnov法的結(jié)果,可能是因?yàn)楫?dāng)樣本太小時(shí),Shapiro-Wilk法和D'Agootino-Pearson法無法給出檢驗(yàn)結(jié)果。當(dāng)然,也可以3種方法都選擇,綜合判斷數(shù)據(jù)是否呈正態(tài)分布。具體在Column statistics下拉菜單中normality and lognormality tests(正態(tài)或?qū)?shù)正態(tài)分布)。選擇好統(tǒng)計(jì)方法之后點(diǎn)擊 'OK', 就可以得到正態(tài)檢驗(yàn)的結(jié)果。 需要特別說明的是:在正態(tài)檢驗(yàn)中,一般認(rèn)為p>0.10才表示數(shù)據(jù)呈正態(tài)分布(是大于,不是小于!是0.10, 不是0.05!)。 06 繪制生存曲線 進(jìn)入上述界面后點(diǎn)擊選中左側(cè) 'Survival' 模式,之后點(diǎn)擊 'Create' , 之后進(jìn)入了GraphPad Prism的主界面。GraphPad Prism 主界面的第一個(gè)縱列(標(biāo)志了 X 的縱列)是用來輸入隨訪時(shí)間的,其余縱列則輸入患者的結(jié)局.每一個(gè)縱列代表了 一個(gè)組。輸入數(shù)據(jù)如下圖: 圖像自動(dòng)生成。 雙擊圖片進(jìn)行顏色修改 07 t檢驗(yàn) t檢驗(yàn)有三種類型:獨(dú)立樣本t檢驗(yàn)、配對(duì)樣本t檢驗(yàn)和單樣本t檢驗(yàn)。若實(shí)驗(yàn)組和對(duì)照組未進(jìn)行配對(duì),在符合獨(dú)立樣本t檢驗(yàn)使用條件的情況下,可采用獨(dú)立樣本t檢驗(yàn)比較兩組數(shù)據(jù)的差異是否具有統(tǒng)計(jì)學(xué)意義;若實(shí)驗(yàn)組和對(duì)照組進(jìn)行配對(duì),在符合配對(duì)樣本t檢驗(yàn)使用條件的情況下,則應(yīng)該使用配對(duì)t檢驗(yàn)。 獨(dú)立樣本t檢驗(yàn)對(duì)數(shù)據(jù)的基本要求是:1.數(shù)據(jù)呈正態(tài)分布 2.總體方差相等。配對(duì)樣本的t檢驗(yàn)則要求兩組數(shù)據(jù)的差值呈正態(tài)分布 。 數(shù)據(jù)是否符合正態(tài)分布?可以采用Kolmogorov-Smirnov檢驗(yàn)或Shapiro-Wilk檢驗(yàn)。在R中可以使用ks.test函數(shù)。 1. 若數(shù)據(jù)呈正態(tài)分布,若方差整齊,則建議作者采用獨(dú)立樣本t檢驗(yàn)的結(jié)果;但方差不整齊,則可以采用近似t檢驗(yàn)對(duì)數(shù)據(jù)進(jìn)行分析。SPSS軟件在進(jìn)行t檢驗(yàn)時(shí),會(huì)自動(dòng)計(jì)算方差齊性檢驗(yàn)的結(jié)果,并同時(shí)告知t檢驗(yàn)和近似t檢驗(yàn)的統(tǒng)計(jì)學(xué)結(jié)果。 2. 大多數(shù)醫(yī)學(xué)數(shù)據(jù)都不呈正態(tài)分布 ,如血脂、血糖、肝酶、腫瘤標(biāo)志物等.因此不宜使用 t檢驗(yàn)進(jìn)行兩組數(shù)據(jù)的比較 , 而應(yīng)該采用非參數(shù)統(tǒng)計(jì)方法,如Mann-Whitney檢驗(yàn) 。 若實(shí)驗(yàn)設(shè)計(jì)有多個(gè)組,即同一實(shí)驗(yàn)因素下有多個(gè)分組 , 則不宜反復(fù)采用t檢驗(yàn)進(jìn)行組間比較。而應(yīng)該采用單因素方差分析或K.ruskal-Wallis H檢驗(yàn),先從總體上明確幾組之間的差異是否有統(tǒng)計(jì)學(xué)意義,然后根據(jù)研究需要決定是否進(jìn)行兩組間的比較,采用何種方法進(jìn)行比較。 08 卡方檢驗(yàn) 主要用于對(duì)分類資料進(jìn)行比較分析。 處理四格表數(shù)據(jù)是卡方檢驗(yàn)最為常見的用途之一。其目的在于分析”構(gòu)成比”或者”率”之間的差異是否具有統(tǒng)計(jì)學(xué)意義。
總結(jié):分類資料用卡方,等級(jí)資料用秩和。實(shí)際上,從理論上講,若要分析四格表數(shù)據(jù)中的構(gòu)成比或者率之間的差異是否有統(tǒng)計(jì)學(xué)意義, Fisher確切概率法的結(jié)果是最可靠的。若是使用軟件對(duì)數(shù)據(jù)進(jìn)行分析,不論樣本量和最小理論頻數(shù),均可采用Fisher確切概率法。 卡方檢驗(yàn)回答的問題僅僅是"構(gòu)成比”或者"率”之間的差異是否具有統(tǒng)計(jì)學(xué)意義,而不能回答效應(yīng)指標(biāo)的強(qiáng)度高低問題。 對(duì)于等級(jí)資料,不是率和構(gòu)成比的問題,而是分期等問題,所以處理此類數(shù)據(jù)的一般方法是將分期進(jìn)行秩轉(zhuǎn)換,然后以秩和檢驗(yàn)(Mann-Whitney 檢驗(yàn))進(jìn)行統(tǒng)計(jì)分析 。 End. |
|