全文鏈接:https:///?p=33838傳統(tǒng)時(shí)間序列模型允許包含過去觀察到的系列信息,但不允許客戶包含其他可能相關(guān)的信息。例如,假期的影響、競(jìng)爭(zhēng)對(duì)手的活動(dòng)、法律變化、整體經(jīng)濟(jì)或其他外部變量可能解釋了某些歷史變動(dòng),并且可能導(dǎo)致更準(zhǔn)確的預(yù)測(cè)(點(diǎn)擊文末“閱讀原文”獲取完整代碼數(shù)據(jù))。 相關(guān)視頻 另一方面,回歸模型允許客戶從預(yù)測(cè)變量中包含大量相關(guān)信息,但不允許處理ARIMA模型中可以處理的細(xì)微時(shí)間序列動(dòng)態(tài)。在本文中,我們幫助客戶考慮如何擴(kuò)展ARIMA模型,以便允許其他信息被納入模型中。 我們考慮了以下形式的回歸模型: 在本文中,我們?cè)试S回歸中的誤差包含自相關(guān)。例如,如果ηt'遵循ARIMA(1,1,1)模型,我們可以寫成: 其中εt'是一個(gè)白噪聲序列。 估計(jì)在估計(jì)帶有ARMA誤差的回歸模型時(shí),一個(gè)重要的考慮因素是模型中的所有變量必須首先是平穩(wěn)的。因此,我們首先必須檢查yt'和所有預(yù)測(cè)變量(x1,t,...,xk,t)(β,...,γ)是否呈現(xiàn)出平穩(wěn)性。 因此,我們首先對(duì)模型中的非平穩(wěn)變量進(jìn)行差分處理。 如果模型中的所有變量都是平穩(wěn)的,那么我們只需要考慮殘差的ARMA誤差。我們得到如下模型: 其中y′t=yt?yt?1,x′t,i=xt,i?xt?1,i,β′=β?β?1,η′t=ηt?ηt?1,這是一個(gè)帶有ARMA誤差的差分模型。 R中ARIMAX回歸以下R命令:
將擬合模型y′t=β1x′t+η′t,其中η′t=?1η′t?1+εt是一個(gè)AR(1)誤差。這等同于帶有ARIMA誤差的差分模型。 其中ηt是一個(gè)ARIMA(1,1,0)誤差。由于進(jìn)行差分,常數(shù)項(xiàng)消失。如果要在差分模型中包含常數(shù)項(xiàng),需要指定include.drift=TRUE。 最終模型的AICc將被計(jì)算,并且該值可用于確定最佳預(yù)測(cè)變量。也就是說,應(yīng)對(duì)要考慮的所有預(yù)測(cè)變量子集重復(fù)此過程,并選擇AICc值最小的模型。 示例:個(gè)人消費(fèi)和收入圖1顯示了1970年至2016年第3季度個(gè)人消費(fèi)支出和個(gè)人可支配收入的季度變化。我們希望根據(jù)收入變化來預(yù)測(cè)支出變化。
圖1:1970年至2016年第三季度個(gè)人消費(fèi)支出和可支配個(gè)人收入的季度百分比變化。
數(shù)據(jù)已經(jīng)是平穩(wěn)的了(我們考慮的是百分比變化而不是原始支出和收入),因此不需要進(jìn)行差分處理。擬合的模型是 我們可以使用
圖2:從擬合模型中獲取的回歸誤差(ηt)和ARIMA誤差(εt)。 應(yīng)該看出ARIMA誤差類似于一個(gè)白噪聲序列。 圖3: 殘差(即ARIMA誤差)與白噪聲沒有顯著差異。 點(diǎn)擊標(biāo)題查閱往期內(nèi)容 左右滑動(dòng)查看更多 預(yù)測(cè)使用具有ARIMA誤差的回歸模型進(jìn)行預(yù)測(cè)時(shí),我們需要預(yù)測(cè)模型的回歸部分和ARIMA部分,并合并結(jié)果。與普通的回歸模型一樣,為了獲得預(yù)測(cè)值,我們首先需要預(yù)測(cè)預(yù)測(cè)變量。 示例:個(gè)人消費(fèi)和收入我們將計(jì)算未來八個(gè)季度的預(yù)測(cè)值,假設(shè)未來的可支配收入百分比變化將等于過去四十年的平均百分比變化。
圖4:使用采用ARIMA(1,0,2)誤差模型回歸消費(fèi)支出百分比變化與可支配收入百分比變化,獲取的預(yù)測(cè)值。 該模型的預(yù)測(cè)區(qū)間開發(fā)的模型更窄,因?yàn)槲覀儸F(xiàn)在能夠使用收入預(yù)測(cè)變量來解釋數(shù)據(jù)的一部分變異性。 示例:預(yù)測(cè)用電量日用電量可以建模為與溫度有關(guān)的函數(shù)。正如在電費(fèi)單上可以觀察到的,在寒冷的天氣里由于加熱和炎熱的天氣里由于空調(diào)等原因使用更多的電。寒冷和炎熱天氣對(duì)電力需求的增加反映在圖中的U形,其中將日需求與日最高氣溫相關(guān)聯(lián)。 圖5:2014年每日用電量與最高氣溫的關(guān)系。 圖6顯示了每日需求和每日最高氣溫的時(shí)間序列。這些圖強(qiáng)調(diào)了需要一個(gè)非線性動(dòng)態(tài)模型。 圖6:2014年每日用電量和最高溫度。 在此示例中,我們使用
圖7:每日電力需求的動(dòng)態(tài)回歸模型殘差診斷。 該模型的殘差存在顯著的自相關(guān)性,這意味著預(yù)測(cè)區(qū)間可能無法提供準(zhǔn)確的覆蓋范圍。此外,殘差直方圖顯示出一個(gè)正的異常值,這也會(huì)影響預(yù)測(cè)區(qū)間的覆蓋范圍。 使用估計(jì)的模型,我們從2015年1月1日(星期四,新年假日)開始預(yù)測(cè)未來14天的數(shù)據(jù)。
圖8:每日電力需求的動(dòng)態(tài)回歸模型預(yù)測(cè)。所有未來溫度都設(shè)置為26攝氏度,工作日虛擬變量被設(shè)置為已知的未來值。 隨機(jī)趨勢(shì)和確定性趨勢(shì)有兩種不同的方法來對(duì)線性趨勢(shì)進(jìn)行建模。通過回歸模型可以得到一個(gè)“確定性趨勢(shì)”,如下所示: 其中ηt為ARMA過程。通過以下模型可以得到一個(gè)“隨機(jī)趨勢(shì)”: 這類似于帶趨勢(shì)的隨機(jī)游走,但這里的誤差項(xiàng)是一個(gè)ARMA過程,而不僅僅是白噪聲。 盡管這些模型看起來非常相似(它們只有在應(yīng)用到ηt′′時(shí)需要應(yīng)用的差分?jǐn)?shù)量不同),它們的預(yù)測(cè)特性卻非常不同。 示例:國(guó)際游客數(shù)據(jù)
圖9:1980年至2015年年際國(guó)際游客人數(shù)。 圖9顯示了1980年至2015年每年國(guó)際游客總數(shù)。我們將對(duì)這些數(shù)據(jù)擬合一個(gè)確定性趨勢(shì)模型和一個(gè)隨機(jī)趨勢(shì)模型。確定性趨勢(shì)模型的擬合如下:
這個(gè)模型可以表示為: 預(yù)計(jì)每年游客數(shù)量的增長(zhǎng)為0.17百萬人。 或者,可以使用隨機(jī)趨勢(shì)模型進(jìn)行估計(jì)。
這個(gè)模型可以表示為: yt?yt?1=0.173+η′t, 或者等價(jià)地 在這種情況下,游客數(shù)量的預(yù)計(jì)增長(zhǎng)也是0.17百萬人。盡管增長(zhǎng)估計(jì)相似,但預(yù)測(cè)區(qū)間不同,如圖所示。特別是,由于誤差是非平穩(wěn)的,隨機(jī)趨勢(shì)具有更寬的預(yù)測(cè)區(qū)間。
圖10:使用確定趨勢(shì)模型和隨機(jī)趨勢(shì)模型對(duì)國(guó)際游客的年度預(yù)測(cè)。 確定性趨勢(shì)隱含了一個(gè)假設(shè),即趨勢(shì)的斜率不會(huì)隨時(shí)間而變化。另一方面,隨機(jī)趨勢(shì)可以變化,并且估計(jì)的增長(zhǎng)僅被假設(shè)為歷史時(shí)期的平均增長(zhǎng),而不一定是未來觀察到的增長(zhǎng)率。因此,使用隨機(jī)趨勢(shì)進(jìn)行預(yù)測(cè)更安全,特別是對(duì)于較長(zhǎng)的預(yù)測(cè)時(shí)間范圍,在這種情況下,預(yù)測(cè)區(qū)間允許未來增長(zhǎng)的不確定性更大。 |
|