Python의 statsmodels 모듈을 사용하여 ARIMA 모델을 피팅하는 방법을 배웁니다.

coldplay.xixi
풀어 주다: 2021-06-24 19:39:08
앞으로
3839명이 탐색했습니다.

Python의 statsmodels 모듈을 사용하여 ARIMA 모델을 피팅하는 방법을 배웁니다.

무료 학습 추천: python 동영상 튜토리얼

필요한 패키지 및 모듈 가져오기

from scipy import statsimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima.model import ARIMAfrom statsmodels.graphics.tsaplots import plot_predict
plt.rcParams['font.sans-serif']=['simhei']#用于正常显示中文标签plt.rcParams['axes.unicode_minus']=False#用于正常显示负号
로그인 후 복사

1 데이터를 읽고 그래프를 그립니다

data=pd.read_csv('数据/客运量.csv',index_col=0)data.index = pd.Index(sm.tsa.datetools.dates_from_range('1949', '2008'))#将时间列改为专门时间格式,方便后期操作data.plot(figsize=(12,8),marker='o',color='black',ylabel='客运量')#画图
로그인 후 복사

#여기에 사용된 승객 흐름 시계열 데이터 기사: https://download.csdn.net/download/weixin_45590329/14143811
# 시계열 선 차트는 아래와 같습니다. 확실히 데이터는 증가하는 추세를 보입니다. 처음에는 데이터가 안정적이지 않다고 판단됩니다

. 2. 정상성 테스트

sm.tsa.adfuller(data,regression='c')sm.tsa.adfuller(data,regression='nc')sm.tsa.adfuller(data,regression='ct')
로그인 후 복사

3가지 ADF 단위근 테스트를 수행하여 일부 결과에서 볼 수 있듯이 계열이 정상적이지 않음을 발견했습니다

3 데이터에 대해 1차 차분 처리를 수행합니다

diff=data.diff(1)diff.dropna(inplace=True)diff.plot(figsize=(12,8),marker='o',color='black')#画图
로그인 후 복사

Make 데이터의 1차 차이 이후에 선 차트를 작성하고 처음에는 정상이라고 판단합니다

4 .1차 차이 데이터에 대해 정상성 테스트를 수행합니다

sm.tsa.adfuller(diff,regression='c')sm.tsa.adfuller(diff,regression='nc')sm.tsa.adfuller(diff,regression='ct')
로그인 후 복사

그림과 같이 수열이 있음을 나타냅니다. is stationary

5 ARIMA(p, d, q) 순서를 결정합니다

fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(diff.values.squeeze(), lags=12, ax=ax1)#自相关系数图1阶截尾,决定MA(1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(diff, lags=12, ax=ax2)#偏相关系数图1阶截尾,决定AR(1)
로그인 후 복사

자기상관계수 도표 ACF와 부분자기상관계수 도표 PACF에 따라 원본 데이터를 ARIMA(1,1,1)로 결정합니다. 모델

6. 매개변수 추정

model = ARIMA(data, order=(1, 1, 1)).fit()#拟合模型model.summary()#统计信息汇总#系数检验params=model.params#系数tvalues=model.tvalues#系数t值bse=model.bse#系数标准误pvalues=model.pvalues#系数p值#绘制残差序列折线图resid=model.resid#残差序列fig = plt.figure(figsize=(12,8))ax = fig.add_subplot(111)ax = model.resid.plot(ax=ax)#计算模型拟合值fit=model.predict(exog=data[['TLHYL']])
로그인 후 복사

7. 모델 테스트

#8.1.检验序列自相关sm.stats.durbin_watson(model.resid.values)#DW检验:靠近2——正常;靠近0——正自相关;靠近4——负自相关#8.2.AIC和BIC准则model.aic#模型的AIC值model.bic#模型的BIC值#8.3.残差序列正态性检验stats.normaltest(resid)#检验序列残差是否为正态分布#最终检验结果显示无法拒绝原假设,说明残差序列为正态分布,模型拟合良好#8.4.绘制残差序列自相关图和偏自相关图fig = plt.figure(figsize=(12,8))ax1 = fig.add_subplot(211)fig = sm.graphics.tsa.plot_acf(resid.values.squeeze(), lags=12, ax=ax1)ax2 = fig.add_subplot(212)fig = sm.graphics.tsa.plot_pacf(resid, lags=12, ax=ax2)#如果两图都零阶截尾,这说明模型拟合良好
로그인 후 복사

8. 다양한 무료 학습 권장사항을 보려면

python을 방문하세요. 튜토리얼

(영상)

위 내용은 Python의 statsmodels 모듈을 사용하여 ARIMA 모델을 피팅하는 방법을 배웁니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:csdn.net
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿