在這個(gè)復(fù)雜的世界,因素與因素之間往往不是單獨(dú)的,割裂的對(duì)因變量發(fā)生著作用,往往變量間發(fā)生著相互摻雜的關(guān)系,我們稱之為交互作用。今天我們繼續(xù)介紹Logistic回歸的交互效應(yīng)。 五、Logistic回歸模型的交互效應(yīng) (三)定性和定量/連續(xù)變量的交互效應(yīng) 定性變量和定量變量的交互效應(yīng)可分為兩種情況:一種是定性變量為調(diào)節(jié)變量、定量變量為關(guān)鍵自變量;另一種是定量變量為調(diào)節(jié)變量、定性變量為關(guān)鍵自變量。這兩種情況的模型和參數(shù)估計(jì)是一樣的,但是其參數(shù)解釋的意義是不一樣的。今天借《Logistic回歸中的交互效應(yīng)》一書中的例子對(duì)定性變量為調(diào)節(jié)變量、定量變量為關(guān)鍵自變量的交互效應(yīng)進(jìn)行講解。 研究受教育程序和社區(qū)成員政治參與的關(guān)系,假設(shè)相對(duì)了教育程度低的人而言,教育程度越高的人更有可能參與投票,以及這種關(guān)系在不同種族中是否有區(qū)別。研究者就調(diào)查了美國(guó)黑人、西班牙裔和白人的教育程度和投票行為,因變量是是否參與投票。教育年限(定量變量)為關(guān)鍵自變量,種族(定性變量)是調(diào)節(jié)變量。所有種族在分析中要設(shè)為啞變量,Raceblack和Racehispanic,白人是參照組。種族的啞變量和教育年限(Education)交互產(chǎn)生兩個(gè)乘積項(xiàng),那么在Logistic回歸模型中就有5個(gè)自變量:Raceblack、Racehispanic、Education、Raceblack*Education、Racehispanic*Education。表11-11列出了Logistic回歸模型的回歸系數(shù)、OR值及其95%的可信區(qū)間。 表11-11 定性和定量變量交互效應(yīng) 表11-11中的模型1是以白人為參照組的Logistic回歸模型。模型中的教育年限是關(guān)鍵自變量,種族是調(diào)節(jié)變量。模型中的截距項(xiàng)對(duì)應(yīng)的OR值是5.3026,指一個(gè)受了10年教育的白人,參與投票的概率是不投票概率的5.3026倍; 教育年限的回歸系數(shù)是0.4556,此時(shí)回歸系數(shù)不能理解為“主效應(yīng)”,而理解為“條件效應(yīng)”,即調(diào)節(jié)變量為0時(shí)的效應(yīng);OR值是1.5772,意義是指相對(duì)于白人,教育年限每增加一個(gè)單位,投票的發(fā)生比是原來(lái)的1.5772倍,其95%CI是(1.3003,1.9129),沒(méi)有包含1,說(shuō)明教育年限的作用是有統(tǒng)計(jì)學(xué)意義的。 當(dāng)Logistic回歸模型中含有定量(關(guān)鍵自變量)、定性變量(調(diào)節(jié)自變量)、以及定量/定性變量的交互效應(yīng)時(shí),那么定量變量的Logistic回歸模型的OR值是一個(gè)乘積因子,其意義是指定量變量每增加一個(gè)單位,定性變量的參照組發(fā)生比的變化速度。如對(duì)于一個(gè)白人來(lái)說(shuō),教育年限增加一個(gè)單位時(shí),投票的發(fā)生比為5.3026/1.5772=8.3633;如果增加兩個(gè)單位時(shí),投票的發(fā)生比為8.3633/1.5772=13.1906。 如果要研究教育年限對(duì)投票的作用在三個(gè)種族中是否相同,可以重新定義參照組,再進(jìn)行變量賦值,生成新的交互項(xiàng),再構(gòu)建Logistic回歸。表11-11中的模型2和模型3 分別以西班牙裔和美國(guó)黑人為參照組構(gòu)建的模型。如果教育年限的效應(yīng)對(duì)三個(gè)種族是一樣的,即不存在交互效應(yīng),那么3個(gè)種族的乘積因子也應(yīng)當(dāng)相同。如果乘積因子相同,那么兩個(gè)乘積因子的比值應(yīng)等于1或接近1,如果越遠(yuǎn)離1,他們的相差就越大。 表11-12 3個(gè)種族乘積因子及其95%可信區(qū)間 表11-12列出了3個(gè)種族的乘積因子及其95%可信區(qū)間,通過(guò)計(jì)算2個(gè)種族間乘積因子比值可以比較兩者之間的差異,例如: 美國(guó)黑人與白人:1.2919/1.5772=0.8191 西班牙裔與白人:2.4942/1.5772=1.5814 白人與與西班牙裔:1.5772/2.4942=0.6323 美國(guó)黑人與西班牙裔:1.2919/2.4942=0.5180 白人與美國(guó)黑人:1.5772/1.2919=1.2208 西班牙裔與美國(guó)黑人:2.4942/1.2919=1.9306 由以上計(jì)算結(jié)果可以知道計(jì)算的比值與模型1、模型2、模型3中的交互效應(yīng)的回歸系數(shù)相同。模型1為例,美國(guó)黑人的乘積因子與白人的比值是0.8191,接近于1,其OR值的95%可信區(qū)間為(0.6522,1.0288),包含了1,說(shuō)明這兩個(gè)乘積因子的差異沒(méi)有統(tǒng)計(jì)學(xué)意義。由此可知,在變換參照組后,交互項(xiàng)的回歸系數(shù)相應(yīng)改變,但是多項(xiàng)交互效應(yīng)的多層檢驗(yàn)結(jié)果不會(huì)改變。 [1] 繆佳, 譯. Logistic回歸中的交互效應(yīng). 上海: 格致出版社, 2014.[2] 趙亮員, 譯. 定序因變量的Logistic回歸模型. 上海: 格致出版社, 2018.
|