偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<abbr id="qg0g2"></abbr>

<meter id="qg0g2"><button id="qg0g2"><em id="qg0g2"></em></button></meter>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

用Python檢驗(yàn)時(shí)間序列的平穩(wěn)性

作者：佚名 2020-10-27 10:13:06

開(kāi)發(fā) 后端

本文比較詳細(xì)地介紹了判斷時(shí)間序列平穩(wěn)性的3種方法，這3種方法在實(shí)際應(yīng)用中是經(jīng)常用到的，當(dāng)然判斷平穩(wěn)性的方法還有很多種，大家如有需要也可以自行查找相關(guān)資料。

在做時(shí)間序列分析時(shí)，我們經(jīng)常要對(duì)時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn)，而我們常用的軟件是SPSS或SAS，但實(shí)際上python也可以用來(lái)做平穩(wěn)性檢驗(yàn)，而且效果也非常好，今天筆者就講解一下如何用python來(lái)做時(shí)間序列的平穩(wěn)性檢驗(yàn)。

首先我們還是來(lái)簡(jiǎn)單介紹一下平穩(wěn)性檢驗(yàn)的相關(guān)概念。

圖1. 平穩(wěn)性序列的相關(guān)公式

時(shí)間序列的平穩(wěn)性可分為嚴(yán)平穩(wěn)和寬平穩(wěn)。設(shè){Xt}是一時(shí)間序列，對(duì)任意正整數(shù)m，任取t1、t2、t3、...、tm∈T，對(duì)任意整數(shù)τ，假如滿足圖1中式（1），則稱時(shí)間序列{Xt}是嚴(yán)平穩(wěn)時(shí)間序列。而寬平穩(wěn)的定義為，如果{Xt}滿足以下三個(gè)條件：

（1）任取t∈T，有E(Xt·Xt)<∞；

（2）任取t∈T，有E Xt =μ，μ為常數(shù)；

（3）任取t，s，k∈T，且k+s-t∈T，有γ(t, s)=γ(k, k+s-t)

則稱{Xt}為寬平穩(wěn)時(shí)間序列。

因?yàn)閷?shí)際應(yīng)用中我們很難獲得隨機(jī)序列的分布函數(shù)，所以嚴(yán)平穩(wěn)用得極少，主要是使用寬平穩(wěn)時(shí)間序列。

在了解了平穩(wěn)性的基本概念之后，我們?cè)賮?lái)說(shuō)一下平穩(wěn)時(shí)間序列的意義。平穩(wěn)時(shí)間序列的分析也遵循數(shù)理統(tǒng)計(jì)學(xué)的基本原理，都是利用樣本信息來(lái)推測(cè)總體信息。這就要求分析的隨機(jī)變量越少越好（也就是數(shù)據(jù)的維度越小越好），而每個(gè)變量獲得樣本信息越多越好（也就是數(shù)據(jù)的觀測(cè)值越大越好），因?yàn)殡S機(jī)變量越少，分析過(guò)程越簡(jiǎn)單，樣本容量越大，分析的結(jié)果越可靠。但時(shí)間序列的數(shù)據(jù)結(jié)構(gòu)有其特殊性，它在任意時(shí)刻t的序列值Xt都是一個(gè)隨機(jī)變量，而且由于時(shí)間的不可重復(fù)性，該變量在任意一個(gè)時(shí)刻只能獲得唯一的樣本觀測(cè)值。由于樣本信息太少，如果沒(méi)有其他的輔助信息，這種數(shù)據(jù)結(jié)構(gòu)通常是沒(méi)有辦法分析的，但序列平穩(wěn)性就可以有效解決這個(gè)問(wèn)題。在平穩(wěn)序列中，序列的均值等于常數(shù)就意味著原本含有可列多個(gè)隨機(jī)變量的均值序列{μt, t∈T}變成了一個(gè)常數(shù)序列{μ, t∈T}，原本每個(gè)隨機(jī)變量的均值μt只能依靠唯一的一個(gè)樣本觀察值xt去估計(jì)，現(xiàn)在由于μt=μ，于是每一個(gè)樣本觀察值xt，都變成了常數(shù)均值的樣本觀察值，如圖1中式（2）所示。這就極大減少了隨機(jī)變量的個(gè)數(shù)，并增加了待估參數(shù)的樣本容量，這也就降低了時(shí)序分析的難度。

在了解了時(shí)間序列的平穩(wěn)性之后，我們?cè)賮?lái)詳細(xì)講解一下如何用python來(lái)進(jìn)行檢驗(yàn)。

用python來(lái)進(jìn)行平穩(wěn)性檢驗(yàn)主要有3種方法，分別是時(shí)序圖檢驗(yàn)、自相關(guān)圖檢驗(yàn)以及構(gòu)造統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。

首先來(lái)說(shuō)時(shí)序圖檢驗(yàn)，時(shí)序圖就是普通的時(shí)間序列圖，即以時(shí)間為橫軸，觀察值為縱軸進(jìn)行檢驗(yàn)。這里筆者給出3個(gè)例子，因?yàn)闀r(shí)序圖過(guò)于簡(jiǎn)單，所以筆者在這里直接用Excel作時(shí)序圖，用python也可以，不過(guò)沒(méi)有Excel簡(jiǎn)單。第一個(gè)例子是1964-1999年中國(guó)紗年產(chǎn)量時(shí)間序列（該數(shù)據(jù)來(lái)自北京統(tǒng)計(jì)局），其數(shù)據(jù)如圖2所示，序列圖如圖3所示。圖3中明顯可以看出，中國(guó)紗年產(chǎn)量序列有明顯的遞增趨勢(shì)，所以它一定不是平穩(wěn)序列。

圖2. 紗產(chǎn)量部分?jǐn)?shù)據(jù)截圖

圖3. 紗產(chǎn)量時(shí)序圖

第二個(gè)例子是1962年1月至1975年12月平均每頭奶牛月產(chǎn)奶量時(shí)間序列（數(shù)據(jù)來(lái)自網(wǎng)站http://census-info.us），其數(shù)據(jù)如圖4所示，序列圖如圖5所示。從圖5中可以看出，平均每頭奶牛的月產(chǎn)奶量以年為周期呈規(guī)則的周期性，此外還有明顯的逐年遞增趨勢(shì)，所以該序列也一定不是平穩(wěn)序列。

圖4. 奶牛產(chǎn)量部分?jǐn)?shù)據(jù)截圖

圖5. 奶牛產(chǎn)量時(shí)序圖

第三個(gè)例子是1949年至1998年北京市每年最高氣溫序列（數(shù)據(jù)來(lái)自北京市統(tǒng)計(jì)局），其數(shù)據(jù)如圖6所示，序列圖如圖7所示。從圖7中可以看出，北京市每年的最高氣溫始終圍繞在37度附近隨機(jī)波動(dòng)，沒(méi)有明顯趨勢(shì)或周期，基本可以視為平穩(wěn)序列，但我們還需要利用自相關(guān)圖進(jìn)一步驗(yàn)證。

圖6. 北京最高氣溫部分?jǐn)?shù)據(jù)截圖

圖7. 北京最高氣溫時(shí)序圖

從上面的例子可以看出，時(shí)序圖只能粗略來(lái)判斷一個(gè)時(shí)間序列是否為平穩(wěn)序列，我們可以用自相關(guān)圖來(lái)更進(jìn)一步檢驗(yàn)。要畫自相關(guān)圖，我們就要用到python，下面是相關(guān)代碼。

import pandas as pd  
import matplotlib.pyplot as plt  
from statsmodels.graphics.tsaplots import plot_acf  
temperature = r'C:\Users\北京氣溫.xls'  
milk = r'C:\Users\奶牛產(chǎn)量.xlsx'  
yarn = r'C:\Users\紗產(chǎn)量.xls'  
data_tem = pd.read_excel(temperature, parse_date=True)  
data_milk = pd.read_excel(milk, parse_date=True)  
data_yarn = pd.read_excel(yarn, parse_date=True)  
plt.rcParams.update({'figure.figsize':(8,6), 'figure.dpi':100}) #設(shè)置圖片大小  
plot_acf(data_tem.Tem) #生成自相關(guān)圖  
plot_acf(data_milk.milk_yield)  
plot_acf(data_yarn.yarn_yield)  
plt.show()

畫自相關(guān)圖用到的是statsmodels中的plot_acf方法，這個(gè)方法很簡(jiǎn)單，只需要直接輸入數(shù)據(jù)即可，不過(guò)數(shù)據(jù)要是一維的，生成的3張圖如圖8、圖9和圖10所示。

圖8. 紗產(chǎn)量自相關(guān)圖

圖9. 奶牛產(chǎn)量自相關(guān)圖

圖10. 北京最高氣溫自相關(guān)圖

平穩(wěn)序列通常具有短期相關(guān)性，即隨著延遲期數(shù)k的增加，平穩(wěn)序列的自相關(guān)系數(shù)會(huì)很快地衰減向零，而非平穩(wěn)序列的自相關(guān)系數(shù)的衰減速度會(huì)比較慢，這就是我們利用自相關(guān)圖判斷平穩(wěn)性的標(biāo)準(zhǔn)。我們就來(lái)看下這3張自相關(guān)圖，圖8是紗年產(chǎn)量的自相關(guān)圖，其橫軸表示延遲期數(shù)，縱軸表示自相關(guān)系數(shù)，從圖中可以看出自相關(guān)系數(shù)衰減到零的速度比較緩慢，在很長(zhǎng)的延遲期內(nèi)，自相關(guān)系數(shù)一直為正，然后為負(fù)，呈現(xiàn)出三角對(duì)稱性，這是具有單調(diào)趨勢(shì)的非平穩(wěn)序列的一種典型的自相關(guān)圖形式。再來(lái)看看圖9，這是每頭奶牛的月產(chǎn)奶量的自相關(guān)圖，圖中自相關(guān)系數(shù)長(zhǎng)期位于零軸一邊，這是具有單調(diào)趨勢(shì)序列的典型特征，同時(shí)還呈現(xiàn)出明顯的正弦波動(dòng)規(guī)律，這是具有周期變化規(guī)律的非平穩(wěn)序列的典型特征。最后再來(lái)看下圖10，這是北京每年最高氣溫的自相關(guān)圖，圖中顯示該序列的自相關(guān)系數(shù)一直比較小，可以認(rèn)為該序列一直在零軸附近波動(dòng)，這是隨機(jī)性較強(qiáng)的平穩(wěn)序列通常具有的自相關(guān)圖。

最后我們?cè)僦v一下ADF方法。前面兩種方法都是作圖，圖的特點(diǎn)是比較直觀，但不夠精確，而ADF法則是直接通過(guò)假設(shè)檢驗(yàn)的方式來(lái)驗(yàn)證平穩(wěn)性。ADF（全稱Augmented Dickey-Fuller）是一種單位根檢驗(yàn)方法，單位根檢驗(yàn)方法比較多，而ADF法是比較常用的一種，其和普通的假設(shè)檢驗(yàn)沒(méi)有太大區(qū)別，都是列出原假設(shè)和備擇假設(shè)。ADF的原假設(shè)（H0）和備擇假設(shè)（H1）如下。

H0：具有單位根，屬于非平穩(wěn)序列。

H1：沒(méi)有單位根，屬于平穩(wěn)序列，說(shuō)明這個(gè)序列不具有時(shí)間依賴型結(jié)構(gòu)。

下面我們就用python代碼來(lái)解釋一下ADF的用法。

from statsmodels.tsa.stattools import adfuller  
yarn_result = adfuller(data_yarn.yarn_yield) #生成adf檢驗(yàn)結(jié)果  
milk_result = adfuller(data_milk.milk_yield)  
tem_result = adfuller(data_tem.Tem)  
print('The ADF Statistic of yarn yield: %f' % yarn_result[0])  
print('The p value of yarn yield: %f' % yarn_result[1])  
print('The ADF Statistic of milk yield: %f' % milk_result[0])  
print('The p value of milk yield: %f' % milk_result[1])  
print('The ADF Statistic of Beijing temperature: %f' % tem_result[0])  
print('The p value of Beijing temperature: %f' % tem_result[1])

這里我們用的是statsmodels中的adfuller方法，其使用也比較簡(jiǎn)單，直接輸入數(shù)據(jù)即可，但其返回值較多，返回的結(jié)果中共有7個(gè)值，分別是adf、pvalue、usedlag、nobs、critical values、icbest和resstore，這7個(gè)值的意義大家可以參考官方文檔，我們這里用到的是前兩個(gè)，即adf和pvalue，adf就是ADF方法的檢驗(yàn)結(jié)果，而pvalue就是我們常用的p值。我們的得到結(jié)果如圖11所示。

圖11. ADF檢驗(yàn)結(jié)果

在圖11中，我們可以看到，紗產(chǎn)量、奶牛產(chǎn)量和北京氣溫的adf值分別是-0.016384、-1.303812和-8.294675，這個(gè)值理論上越負(fù)越能拒絕原假設(shè)，但我們?cè)谶@里不用adf來(lái)判斷，而是用p值。這3個(gè)p值分別是0.957156、0.627427和0.000000，以常用的判斷標(biāo)準(zhǔn)值0.05作為參考，前兩個(gè)p值都遠(yuǎn)大于0.05，說(shuō)明其是支持原假設(shè)的，說(shuō)明紗產(chǎn)量和奶牛產(chǎn)量都是非平穩(wěn)序列，而北京氣溫序列的p值為零，說(shuō)明是拒絕原假設(shè)，表明該序列是一個(gè)平穩(wěn)序列。我們可以看到，利用adf法和前面兩種方法得到的結(jié)果是一致的。

本文比較詳細(xì)地介紹了判斷時(shí)間序列平穩(wěn)性的3種方法，這3種方法在實(shí)際應(yīng)用中是經(jīng)常用到的，當(dāng)然判斷平穩(wěn)性的方法還有很多種，大家如有需要也可以自行查找相關(guān)資料。

責(zé)任編輯：龐桂玉來(lái)源： Python中文社區(qū)

Python 時(shí)間序列代碼

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<wbr id="ljokf"></wbr>

<menuitem id="ljokf"><ul id="ljokf"></ul></menuitem>

<tr id="ljokf"></tr>

<abbr id="ljokf"><menu id="ljokf"></menu></abbr><ruby id="ljokf"><dfn id="ljokf"></dfn></ruby>