最新动态
时间序列算法---ARIMA
2024-12-29 21:08

  现代时间序列分析方法主要有两个不同的方向:一个方向是由外向内的分析视角产生的方法是与确定性因素分解相关的方法;一个方向是由内向外的分析视角产生的方法是时域分析方法

  因素分解方法认为所有的序列波动都可以归纳为受到如下四大类因素的综合影响
长期趋势(Trend)。序列呈现出明显的长期递增或递减的变化趋势。
循环波动(Circle)。序列呈现出从低到高再由高到低的反复循环波动。循环周期可长可短,不一定是固定的。
季节性变化(Season)。序列呈现出和季节变化相关的稳定周期波动。
随机波动(lmmediate)。除了长期趋势、循环波动和季节性变化之外,其他不能用确定性因素解释的序列波动,都属于随机波动。
常用的模型
加法模型:x=T+C+S+I
乘法模型:x=TCS*I

1.1、确定性因素分析方法

指数平滑预测方法
  简单指数平滑(平稳序列预测)
  Holt两参数指数平滑(趋势序列预测)
  HoltWinters三参数指数平滑(周期序列预测
以X11/X12模型为核心的各种季节调整模型
  X11模型是第二次世界大战之后,美国人口普查局委托统计学家进行的基于计算机自动进行的时间序列因素分解方法。1954年,X0版本面世,随后十多年陆续推出新的改进版本。1965年,推出成熟版本X11。
  1975年,加拿大统计局将ARIMA模型引入X11模型,开发了X11-ARIMA模型。ARIMA模型可以对序列进行向后预测扩充数据,以保证拟合数据的完整性,弥补了中心移动平均方法的缺陷。
  1998年,美国人口普查局开发了X12-ARIMA模型。它的改进是将一些特殊因素作为干预变量引入研究。这些干预变量包括:特殊节假日、固定季节因素、工作日因素、交易日因素、闰年因素,以及研究人员自行定义的任意自变量。
  2006年美国人口普查局再次推出更新版本X13-ARIMA-Seats,它是在X12-ARIMA的基础上,增加了seats季节调整方法。

  时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。
时域分析方法的理论基础Wold分解定理Cramer分解定理
  Wold分解定理证明任何平稳序列都可以分解为确定性序列随机序列之和;Wold分解定理是现代时间序列分析理论的灵魂,是构造ARMA模型拟合平稳序列的理论基础。基于Wold分解定理可以建立AR模型MA模型ARMA模型
  Cramer是Wold的指导老师,Cramer分解定理(1962年)是Wold分解定理的理论推广,它是非平稳序列的分解理论,是构造ARIMA模型的理论基础。基于Cramer分解定理可以建立ARIMA模型

2.1、ARMA模型(自回归移动平均模型

  同一现象在不同时间上的相继观察值排列而成的序列,这些观察值是一个个随机变量,所以时间序列是随机变量序列。通常可以分为三大类白噪声序列平稳非白噪声序列非平稳序列

2.1.1、建模流程
2.1.2、模型的平稳性检验-----单位根检验

  对平稳序列建模首先需要确定序列是平稳的。平稳性检验方法有图检验法单位根检验法(DF检验和ADF检验
  图检验法:平稳时间序列具有常数均值和方差。这意味着平稳序列的时序图应该显示出该序列始终在一个常数值附近波动,而且波动的范围有界的特点。图检验方法主要适用于趋势或周期比较明显的序列,对于趋势或周期不太明显的序列,通过图检验方法来判断序列的平稳性具有一定的主观性。图检验法分为时序图检验自相关图检验
  自相关图是一个平面二维坐标悬垂线图,横坐标表示延迟时期数,纵坐标表示自相关系数,悬垂线的长度表示自相关系数的大小。平稳序列通常具有短期相关性,这就是我们利用自相关图进行平稳性判别的标准,该性质用自相关系数来描述就是随着延迟阶数k的增加,平稳序列的自相关系数P会很快地衰减向零;而非平稳序列的自相关系数P衰减向零的速度通常比较慢
  单位根检验:如果序列是平稳的,那么该序列的所有特征根都应该在单位圆内。如果序列有特征根在单位圆上或单位圆外,那么该序列就是非平稳序列。

2.1.3、纯随机性(白噪声)检验-----Q统计量和LB统计量
2.1.3、模型的参数(p,q)识别-----ACF、PACF
2.1.4、参数估计
2.1.4.1、矩估计
2.1.4.2、极大似然估计
2.1.4.3、最小二乘估计
2.1.5、模型检验
2.1.5.1、模型显著性检验-----残差序列白噪声检验
2.1.5.2、参数的显著性检验----T检验
2.1.6、模型优化

2.2、ARIMA(差分自回归移动平均模型)—无季节效应的非平稳序列

  Cramer分解定理说明任何一个序列的波动都可以视为同时受到确定性影响和随机性影响的作用。平稳序列要求这两方面的影响都是稳定的,而非平稳序列产生的机理就在于它所受到的这两方面的影响至少有一方面是不稳定的。Cramer 分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。
  实践中,我们会根据序列的不同特点选择合适的差分方式,常见情况有以下三种
(1)序列蕴含显著的线性趋势,1阶差分就可以实现趋势平稳。
(2)序列蕴含曲线趋势,通常低阶(2 阶或 3阶)差分就可以提取出曲线趋势的影响。
(3)蕴含固定周期的序列:对蕴含固定周期的序列进行步长为周期长度(1阶12步)的差分运算,通常可以较好地提取周期信息。

2.2.1、建模流程

3.1、加载数据

 
 

3.2、平稳性检验

 
 

3.3、差分

 
 

3.4、白噪声检验

 
 

3.5、模型参数识别

(1)acf、pacf图

 
 
 
 

3.6、模型拟合

 
 

3.7、模型检验

(1)残差检验
残差自相关性检验
目的:检验模型的残差是否呈现白噪声,确保模型已经捕捉到数据中的主要模式。
方法:常用 Ljung-Box Q 检验 来判断残差的自相关性。
指标:Ljung-Box Q 统计量和相应的 p 值。若 p 值较大(通常大于 0.05,说明残差序列无显著自相关性,可以认为模型有效。

 
 
 
 

残差偏度和峰度检验
目的:进一步描述残差的分布特性。
方法:通过 偏度 (Skewness) 和 峰度 (Kurtosis) 指标描述残差分布的形状。
指标
偏度 (Skew):反映残差分布的对称性。接近 0 表示对称,正值表示右偏,负值表示左偏。
峰度 (Kurtosis):反映残差分布的尖峰程度。接近 3 表示正态分布,较大值表示重尾分布。

(2)参数的显著性检验
ar.L1 至 ar.L5: 自回归(AR)部分的5个滞后项。可以看到其中 ar.L1、ar.L2、ar.L3 和 ar.L4 的系数在统计上显著。
ma.L1 至 ma.L4: 移动平均(MA)部分的4个滞后项。同样,ma.L1、ma.L2 和 ma.L3 系数显著。
sigma2: 残差的方差,反映模型未解释部分的波动性。

3.8、模型拟合预测


    以上就是本篇文章【时间序列算法---ARIMA】的全部内容了,欢迎阅览 ! 文章地址:https://sicmodule.kub2b.com/quote/15661.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站https://sicmodule.kub2b.com/mobile/,查看更多   
发表评论
0评