從許多方面來看,回歸分析都是統(tǒng)計學(xué)的核心。它其實是一個廣義的概念,通指那些用一個或多個預(yù)測變量(也稱自變量或解釋變量)來預(yù)測響應(yīng)變量(也稱因變量或結(jié)果變量)的方法。1、挑選與因變量相關(guān)的自變量 2、描述因變量與自變量之間的關(guān)系強(qiáng)度 3、生成模型,通過自變量來預(yù)測因變量 4、根據(jù)模型,通過因變量,來控制自變量 回歸是一個令人困惑的詞,因為它有許多特殊的變種。下面將對回歸分析的各種變種進(jìn)行一個匯總: 哈哈,這是最簡單的一種線性回歸,模型中只有一個Y和X。用一個量化的自變量預(yù)測一個量化的因變量。做回歸之前,一般應(yīng)該先做一個散點圖看看,看看有無線性趨勢,沒有的話就不用回歸啦!用一個量化的自變量預(yù)測一個量化的因變量,但是模型的關(guān)系是n階多項式。我們常說的均勻設(shè)計方差分析,往往采用的就是多項式回歸哦!Y為正態(tài)分布的連續(xù)性資料,多個X自變量,自變量可以使連續(xù)性資料、等級資料以及分類變量,但是注意哦,分類變量需要設(shè)置啞變量的。簡言之,多元線性回歸是用兩個或多個量化的自變量預(yù)測一個量化的因變量。當(dāng)研究的結(jié)局變量為分類變量時,采用的回歸分析方法,具體包含3類,二元Logistic回歸,等級Logistic回歸以及多項Logistic回歸。用一個或多個自變量預(yù)測一個類別型的因變量用一個或多個自變量預(yù)測一個代表頻數(shù)的因變量,常用于小概率事件回歸預(yù)測。前面說的回歸,只考慮到結(jié)果,而并沒有考慮結(jié)果出現(xiàn)的時間,而結(jié)果出現(xiàn)的時間肯定會反映干預(yù)措施的作用強(qiáng)弱。而COX回歸,就是不經(jīng)考慮結(jié)果而且考慮結(jié)果出現(xiàn)時間的回歸模型。它用用一個或多個自變量預(yù)測一個事件(死亡、失敗或舊病復(fù)發(fā))發(fā)生的時間。COX回歸的主要作用發(fā)現(xiàn)風(fēng)險因素并用于探討風(fēng)險因素的強(qiáng)弱。對誤差項相關(guān)的時間序列數(shù)據(jù)建模,對未來時間的數(shù)據(jù)進(jìn)行預(yù)測。如搜集某地連續(xù)10年的月平均氣溫,建立時間序列分析,就可以對最近1-3年的月平均氣溫進(jìn)行預(yù)測啦!線性回歸是目前發(fā)展最為成熟的模型,所以能用線性盡量用,不能線性的想辦法轉(zhuǎn)化,轉(zhuǎn)化不成功的,考慮非線性,它是用一個或多個量化的自變量預(yù)測一個量化的因變量,不過模型是非線性的。用一個或多個量化的自變量預(yù)測一個量化的因變量,模型的形式源自數(shù)據(jù)形式,不事先設(shè)定.用一個或多個量化的自變量預(yù)測一個量化的因變量,能抵御強(qiáng)影響點的干擾。主成分回歸,它其實就是在進(jìn)行主成分分析后,提取主成分作為自變量進(jìn)行的線性回歸。主成分回歸是解決共線性的一種方法。對數(shù)線性模型是用于離散型數(shù)據(jù)或整理成列聯(lián)表格式的計數(shù)資料的統(tǒng)計分析工具。在對數(shù)線性模型中,所有用作分類的因素均為獨立變量,列聯(lián)表各單元格中的例數(shù)為因變量。對于列聯(lián)表,卡方檢驗無法系統(tǒng)評價變量間的關(guān)系,也無法估計變量間的作用大小,而對數(shù)線性模型是處理這些問題的最佳方法。PLS是對一般最小二乘回歸(ordinaryleastsquaresregression,OLS)的擴(kuò)展,是集多因變量對多自變量的回歸建模以及主成分分析為一體的多元數(shù)據(jù)分析方法,在一次計算之后即可同時實現(xiàn)預(yù)測建模以及多變量系統(tǒng)的綜合簡化。與OLS或其他建模方法相比,具有簡單穩(wěn)健、計算量小、預(yù)測精度高、無需剔除,任何解釋變量或樣本點、所構(gòu)造的潛變量較確定、易于 定性解釋等優(yōu)點。PLS通常用于數(shù)據(jù)的“軟”建模,建立因變量關(guān)于自變量的線形甚至非線形回歸預(yù)測方程,特別是在自變量大于觀察個數(shù)的情況下,相當(dāng)有效。 Probit回歸意思是“概率回歸”。用于因變量為分類變量數(shù)據(jù)的統(tǒng)計分析,與Logistic回歸近似。也存在因變量為二分、多分與有序的情況。目前最常用的為二分。醫(yī)學(xué)研究中常見的半數(shù)致死劑量、半數(shù)有效濃度等劑量反應(yīng)關(guān)系的統(tǒng)計指標(biāo),現(xiàn)在標(biāo)準(zhǔn)做法就是調(diào)用Pribit過程進(jìn)行統(tǒng)計分析。還包括灰色系統(tǒng)模型、模糊、熵等,用的不多。
松哥:統(tǒng)計分析可謂初級說一說(描述性分析),中級比一比(差異性分析),高級找關(guān)系(建模型)。統(tǒng)計分析的復(fù)雜與美妙之處就在于模型構(gòu)建。回歸是構(gòu)建模型的一種方法,但回歸對于很多人來說都是令人困惑的,因為它有許多特殊的變種。有效的回歸分析本身就是一個交互、整體的、多步驟的過程,而不僅僅是一點技巧,一起努力吧!
|