跳到主要内容

《应用时间序列分析》笔记(第三部分:非平稳序列建模)

5 无季节效应的非平稳序列分析

5.1 Cramer 分解定理

  Cramer 分解定理将 Wold 分解定理推广到非平稳序列. Cramer 分解定理指出任意时间序列 {Xt}\{X_t\} 都可以视为两部分叠加, 一部分是时间 tt 的多项式决定的确定性成分, 一部分是白噪音决定的随机性成分, 即

Xt=μt+εt=(β0+β1t++βdtd)+(atψ1at1+)X_t = \mu _t + \varepsilon _t = (\beta _0 + \beta _1 t + \cdots + \beta _d t_d) + (a_t - \psi _1 a_{t-1} + \cdots)

其中 atWN(0,σa2)a_t \sim \mathrm{WN}(0, \sigma _a^2) 是白噪声.

5.2 差分平稳

差分运算 定义差分算子 =1B\nabla = 1 - \mathrm B, 所以

Xt=(1B)Xt=XtXt1    Xt=Xt1+Xt\nabla X_t = (1 - \mathrm B) X_t = X_t - X_{t-1} \quad \iff \quad X_t = X_{t-1} + \nabla X_t

定义 DD 步差分算子 d=1BD\nabla _d = 1 - \mathrm B^D, 所以

DXt=(1BD)Xt=XtXtD    Xt=XtD+DXt\nabla _D X_t = (1 - \mathrm B^D) X_t = X_t - X_{t-D} \quad \iff \quad X_t = X_{t-D} + \nabla _D X_t

定义 dd 阶差分算子 d=(1B)d\nabla ^d = (1 - \mathrm B)^d, 所以

dXt=k=0d(1)k(dk)Xtk\nabla ^d X_t = \sum _{k=0}^d (-1)^k \binom dk X_{t-k}

Cramer 分解定理在理论上保证了 dd 阶差分就可以将 {Xt}\{X_t\} 中蕴含的确定性信息充分提取出来. 差分运算的实质就是使用自回归的方式提取序列中蕴含的确定性信息.

差分方式的选择 观察一个数据的时序图, 差分方式可以有如下选择

  • 序列蕴含显著线性趋势, {Xt}\{\nabla X_t\} 就可实现趋势平稳.
  • 序列蕴含曲线趋势, 通常 {2Xt}\{\nabla ^2 X_t\}{3Xt}\{\nabla ^3 X_t\} 就提取趋势影响.
  • 序列蕴含周期 DD, 考虑周期差分后进行差分, 即 {dDXt}\{\nabla ^d \nabla _D X_t\}, 其中通常 d=0,1,2,3d = 0, 1, 2, 3 即可实现平稳.

过差分 差分会有信息损失. 如果差分阶数过大, 则会导致精度降低. 因为虽然差分没有丢失确定项的信息, 但是差分后序列叠加了多个随机项, 导致模型方差扩大数倍. 例如线性非平稳序列

Xt=β1t+atX_t = \beta _1 t + a_t

它的一阶和二阶差分分别是

Xt=β1+at+at1,2Xt=at2at1+at2\nabla X_t = \beta _1 + a_t + a_{t-1}, \qquad \nabla ^2 X_t = a_t - 2a_{t-1} + a_{t-2}

它们都是平稳序列, 但是方差分别是

DXt=2σa2,D2Xt=6σa2\mathrm D\nabla X_t = 2\sigma _a ^2, \qquad \mathrm D\nabla ^2 X_t = 6\sigma _a ^2

5.3 ARIMA 模型

  ARIMA(p,d,q)\mathrm{ARIMA}(p, d, q) 模型有如下结构:

{dXt=Φ(B)Θ(B)εtεtWN(0,σε2),Xsεt,s<t\left\{ \begin{aligned} & \nabla ^d X_t = \frac{\Phi(\mathrm B)}{\Theta(\mathrm B)} \varepsilon _t\\ & \varepsilon _t \sim WN(0, \sigma _\varepsilon ^2), \quad X_s \perp \varepsilon _t, \forall s < t \end{aligned} \right.

ARIMA 中的 I 是 integrated (求和), 因为差分算子可以根据 Gauss 二项式定理展开为一个和式. 特别地, p=0p = 0 时模型退化为 IMA(d,q)\mathrm{IMA}(d, q) 模型, q=0q = 0 时模型退化为 ARI(p,d)\mathrm{ARI}(p, d) 模型.

平稳性 假设 ARIMA(p,d,q)\mathrm{ARIMA}(p, d, q) 的 AR 部分的特征方程是 λpφ1λp1φp=0\lambda^p - \varphi _1 \lambda^{p-1} - \cdots - \varphi _p = 0, 则 ARIMA 模型的特征方程是

(λpφ1λp1φp)(1λd)=0(\lambda^p - \varphi _1 \lambda^{p-1} - \cdots - \varphi _p)(1 - \lambda ^d) = 0

它有 p+dp+d 个特征方程, 其中 pp 个是 AR 部分的特征根在单位圆内, dd 个是差分导致的特征根在单位圆上. 所以在 d>0d>0 时 ARIMA 模型不平稳.

方差齐性 以简单随机游走模型 ARIMA(0,1,0)\mathrm{ARIMA}(0, 1, 0) 模型为例

Xt=Xt1+εt=X0+ε1++εt,DXt=tσε2X_t = X_{t-1} + \varepsilon _t = X_0 + \varepsilon _1 + \cdots + \varepsilon _t, \qquad \mathrm DX_t = t\sigma _\varepsilon ^2

但是差分操作 Xt=εt\nabla X_t = \varepsilon _t 后序列具有方差齐性.

建模方法 先对序列进行合理差分, 直到其通过平稳性检验. 然后使用 ARMA 模型进行拟合, 直到残差通过纯随机性检验.

预测 ARIMA 模型可以完全展开成随机扰动项的线性组合

Xt=Ψ0εt+Ψ1εt1++Ψt1ε1X_t = \Psi _0 \varepsilon _t + \Psi _1 \varepsilon _{t-1} + \cdots + \Psi _{t-1} \varepsilon _1

它也有类似 Green 函数的展开

Ψk={1,k=0φ1Ψk1++φkΨ0θk,k=1,,p+dφ1Ψk1++φpΨkpdθk,k=p+d+1,\Psi _k = \begin{cases} 1, \quad & k = 0\\ \varphi _1 \Psi _{k-1} + \cdots + \varphi _k \Psi _0 - \theta _k, \quad & k = 1, \dots, p+d\\ \varphi _1 \Psi _{k-1} + \cdots + \varphi _p \Psi _{k-p-d} - \theta _k, \quad & k = p+d+1, \dots\\ \end{cases}

这里定义 k>qk>qθk\theta _k 为零. 考虑均方误差最小原则, kk 期预测值为

x^t+k=Ψkεt+Ψk+1εt1+\hat x _{t+k} = \Psi _k \varepsilon _t + \Psi _{k+1} \varepsilon _{t-1} + \cdots

预测误差的方差为

Det+k=(1+Ψ12++Ψk12)σε2\mathrm De_{t+k} = (1 + \Psi _1^2 + \cdots + \Psi _{k-1}^2) \sigma _\varepsilon ^2

5.4 疏系数模型

  ARIMA(p,d,q)\mathrm{ARIMA(p, d, q)}p+qp+q 个未知参数. 有时有些阶参数缺省为 00, 则称该模型为疏系数模型 ARIMA((p1,,pm),d,(q1,,qn))\mathrm{ARIMA}((p_1, \dots, p_m), d, (q_1, \dots, q_n))

dXt=φ0+φp1dXtp1++φpmdXtpm+εtθq1εtq1θqnεtqn\nabla ^d X_t = \varphi _0 + \varphi _{p_1} \nabla ^d X_{t-p_1} + \cdots + \varphi _{p_m} \nabla ^d X_{t-p_m} + \varepsilon _t - \theta _{q_1} \varepsilon _{t-q_1} - \cdots - \theta _{q_n} \varepsilon _{t-q_n}\\

建模方法 先对序列进行合理差分, 直到其通过平稳性检验. 然后使用 ARMA 模型进行拟合并删除不显著的参数, 直到残差通过纯随机性检验.

6 有季节效应的非平稳序列分析

6.1 因素分解理论

  1919 年商业统计学家 Warren Persons 首次提出了确定性因素分解思想. Persons 将时间序列分为四个部分:

  • 长期趋势 (Trend), 即序列的长期趋势.
  • 循环波动 (Circle), 即不固定的循环波动.
  • 季节性变化 (Season), 即固定的循环波动.
  • 随机性波动 (Irrelevance), 即随机波动.

任意时间序列都可以用这四个因素的某个函数拟合

Xt=f(Tt,Ct,St,It)X_t = f(T_t, C_t, S_t, I_t)

最常用的是加法模型和乘法模型

Xt=Tt+Ct+St+It,Xt=TtCtStItX_t = T_t + C_t + S_t + I_t, \qquad X_t = T_t \cdot C_t \cdot S_t \cdot I_t

加法模型常用于拟合波动趋势不随时间变化的序列, 乘法模型常用于拟合波动范围随趋势递增而扩大、呈现喇叭形的序列.

特殊交易日因素 在经济学领域, 容易出现两个问题:

  • 若观察时期不够长, 则循环因素和趋势因素很难区分. 较长的经济循环周期可达数十年. 若观察时间仅有几年, 则循环因素很容易被当成趋势因素.
  • 传统因素分解模型没有研究交易日、工作日、周末、节假日等的影响.

近年来针对这两个问题, 人们将循环因素 CtC_t 改进为特殊交易日因素 (day) DtD_t. 常用因素分解模型有以下几种:

  • 加法模型 Xt=Tt+St+Dt+ItX_t = T_t + S_t + D_t + I_t.
  • 乘法模型 Xt=TtStDtItX_t = T_t \cdot S_t \cdot D_t \cdot I_t.
  • 伪加法模型 Xt=Tt(St+Dt+It)X_t = T_t \cdot (S_t + D_t + I_t).
  • 对数加法模型 lnXt=lnTt+lnSt+lnDt+lnIt\ln X_t = \ln T_t + \ln S_t + \ln D_t + \ln I_t.

6.2 因素分解模型

6.2.2 趋势效应的提取

  在因素分解场合, 最常用的趋势效应提取法是简单中心移动平均. 考虑移动平均可以表示为

M(xt)=θkxtk++θ0xt++θkxt+kM(x_t) = \theta _{-k} x_{t-k} + \cdots + \theta _0 x_t + \cdots + \theta _{k'} x_{t+k'}

其中 θk++θ0++θk=1\theta _{-k} + \cdots + \theta _0 + \cdots + \theta _{k'} = 1.

简单中心移动平均 即所有系数相等的对称平均. 考虑移动窗口长度 nn,

  • nn 为奇数例如 n=3n=3, 则 33 期简单中心移动平均为
M3(xt)=13(xt1+xt+xt+1)M_3(x_t) = \frac 13 (x_{t-1} + x_t + x_{t+1})
  • nn 为偶数例如 n=4n=4, 则 44 期简单中心移动平均为
M4(xt)=14(xt22+xt1+xt+xt+1+xt+22)M_4(x_t) = \frac 14 \left( \frac{x_{t-2}}2 + x_{t-1} + x_t + x_{t+1} + \frac{x_{t+2}}2 \right)

线性趋势的提取 简单中心移动平均能有效提取线性趋势. 设 XtN(a+bt,σ2)X_t \sim N(a + bt, \sigma ^2), 则可以证明 2k+12k+1 期简单中心移动平均是无偏的. 即

EM(Xt)=a+bt\mathrm E M(X_t) = a + bt

抛物线趋势的提取 简单中心移动平均能提取抛物线趋势, 但会在结局上有一个小偏差. 设 XtN(a+bt+ct2,σ2)X_t \sim N(a + bt + ct^2, \sigma ^2), 则可以计算

EM(Xt)=a+bt+ct2+ck(k+1)3\mathrm E M(X_t) = a + bt + c t^2 + c\frac{k(k+1)}{3}

6.2.3 季节效应的提取

加法模型 假设序列由加法模型 Xt=Tt+St+ItX_t = T_t + S_t + I_t 生成. 则季节指数的构造分为四步

  1. 消除趋势效应 Yt:=XtTt=St+ItY_t := X_t - T_t = S_t + I_t.

  2. 对于每一个季节 jj, 季节指数定义为该季节所有值的平均值比总平均值高(低)多少. 即

    Sj=YˉSeason jYˉS_j = \bar Y_{\text{Season } j} - \bar Y
  3. 减去季节指数 YtSjY_t - S_j, 剩下的就是随机波动 ItI_t.

乘法模型 假设序列由乘法模型 Xt=TtStItX_t = T_t \cdot S_t \cdot I_t 生成. 则季节指数的构造分为四步

  1. 消除趋势效应 Yt:=Xt/Tt=StItY_t := X_t / T_t = S_t \cdot I_t.

  2. 对于每一个季节 jj, 季节指数定义为该季节所有值的平均值比总平均值高(低)多少倍. 即

    Sj=YˉSeason j/YˉS_j = \bar Y_{\text{Season } j} / \bar Y
  3. 除以季节指数 Yt/SjY_t / S_j, 剩下的就是随机波动 ItI_t.

6.2.4 X11 季节调节模型

  X11 模型是二战后美国人口普查局委托统计学家研发的基于计算机程序的时间序列因素分解方法.

  • 1954 年起, 第一个计算机程序测试版本面试, 随后十多年中陆续推出了新的测试版本 X1 模型、X2 模型直至 X10 模型.
  • 1965 年, 统计学家 Shiskin, Young 和 Musgrave 引入了两种新的移动平均方法, 研发了 X11 模型. X11 模型通过三种移动平均方法进行三阶段因素分解, 是因素分解的常用模型.
  • 1975 年, 加拿大统计局将 ARIMA 模型引入 X11 模型, 研发了 X11-ARIMA 模型.
  • 1998 年, 美国人口普查局将干预分析 (将在 8.2 节介绍) 引入, 研发了 X12-ARIMA 模型.
  • 2006 年, 美国人口普查局将 Seats 季节调整方法引入, 研发了 X13-ARIMA-Seats 模型.

尽管现在有很多新的因素分解方法, 但是 X11 模型仍然是最重要的理论基础.

Henderson 加权移动平均 简单中心移动平均能提取一阶和二阶趋势, 但无法提取三阶趋势. Henderson 加权移动平均希望在提取一二阶趋势的情况下、还能尽量提取三阶趋势, 即给定期数 kk, 求权值 θk,,θk\theta _{-k}, \dots, \theta _k, 满足

mini=kk(3θi)2s.t.mini=kkθi=1,mini=kkiθi=0\min \sum _{i=-k}^k (\nabla ^3 \theta _i)^2 \qquad \text{s.t.} \qquad \min \sum _{i=-k}^k \theta _i = 1, \quad \min \sum _{i=-k}^k i \theta _i = 0

例如在 k=3k=3 时, 有

θ0=0.55944,θ±1=0.29371,θ±2=0.07343\theta _0 = 0.55944, \qquad \theta _{\pm 1} = 0.29371, \qquad \theta _{\pm 2} = -0.07343

Musgrave 非对称移动平均 给定一组中心移动平均系数 θk,,θk\theta _{-k}, \dots, \theta _k, Musgrave 非对称移动平均尝试找到一组尽可能等效的移动平均系数 φk,,φkd\varphi _{-k}, \dots, \varphi _{k-d}, 使得它不包含最前的 dd 期预测值. 即希望

E(i=kkθiεtii=(kd)kφiεti)2=min\mathrm E \left( \sum _{i=-k}^k \theta _i \varepsilon _{t-i} - \sum _{i=-(k-d)}^k \varphi _i \varepsilon _{t-i} \right)^2 = \min

X11 模型 X11 模型包含三个阶段共 10 步重复迭代:

  • 第一阶段:
    • 第 1 步: 进行 2424 期简单中心移动平均 Tt(1)=M24(Xt)T_t^{(1)} = M_{24}(X_t) 剔除周期效应, 得到趋势效应初始估计值.
    • 第 2 步: 剔除趋势效应, 得到季节-不规则成分 Yt(1)=Xt/Tt(1)=St(1)It(1)Y_t^{(1)} = X_t / T_t^{(1)} = S_t^{(1)} I_t^{(1)}
    • 第 3 步: 计算序列 Yt(1)Y_t^{(1)} 的季节指数 St(1)=Yt(1)/Yˉt(1)S_t^{(1)} = Y_t^{(1)} / \bar Y_t^{(1)}.
    • 第 4 步: 剔除季节效应, 得到趋势-不规则成分 Xt(2)=Xt/St(1)=TtItX_t^{(2)} = X_t / S_t^{(1)} = T_t I_t
  • 第二阶段:
    • 第 5 步: 进行 1313 期 Henderson 加权移动平均 Tt(2)=H13(Xt(2))T_t^{(2)} = H_{13}(X_t^{(2)}), 并用 Musgrave 非对称移动平均填补 Henderson 加权平均不能获得的末几期估计值, 得出趋势效应估计值.
    • 第 6 步: 剔除趋势效应 Yt(2)=Xt(2)/Tt(2)=St(2)It(2)Y_t^{(2)} = X_t^{(2)} / T_t^{(2)} = S_t^{(2)} I_t^{(2)}, 得到季节-不规则成分.
    • 第 7 步: 计算序列 Yt(2)Y_t^{(2)} 最终的季节指数 St(2)=Yt(2)/Yˉt(2)S_t^{(2)} = Y_t^{(2)} / \bar Y_t^{(2)}.
    • 第 8 步: 剔除季节效应, 得到季节调整后序列 Xt(3)=Xt/St(2)=TtItX_t^{(3)} = X_t / S_t^{(2)} = T_t I_t.
  • 第三阶段:
    • 第 9 步: 根据 {Xt(3)}\{X_t^{(3)}\} 的波动性大小, 程序自动选择适当期数的 Henderson 加权移动平均, 并用 Musgrave 非对称移动平均填补末几期估计值, 计算最终趋势效应 Tt(3)=H2k+1(Xt(3))T_t^{(3)} = H_{2k+1}(X_t^{(3)})
    • 第 10 步: 剔除趋势效应, 得到最终随机波动 It(3)=Xt(3)/Tt(3)I_t^{(3)} = X_t^{(3)} / T_t^{(3)}

在第 7 步、第 9 步和第 10 步中分别得到了季节、趋势和随机波动的三个估计值. 最后将它们组合起来, 得到最终的因素分解结果.

Xt=Tt(3)St(2)It(3)X_t = T_t^{(3)} S_t^{(2)} I_t^{(3)}

6.3 指数平滑预测模型

6.3.1 简单指数平滑

  简单指数平滑可以拟合无长期趋势也无季节效应的序列. 即假定序列 XtX_t 满足

Xt=μ+εt,εti.i.dN(0,σ2)X_t = \mu + \varepsilon _t, \qquad \varepsilon _t \overset{\text{i.i.d}}{\sim} N(0, \sigma^2)

简单指数平滑的预测模型为

X^t+1=αXt+(1α)X^t\hat X _{t+1} = \alpha X_t + (1 - \alpha) \hat X_t

可以展开为

X^t+1=αXt+α(1α)Xt1+α(1α)2Xt2+\hat X _{t+1} = \alpha X_t + \alpha (1 - \alpha) X_{t-1} + \alpha (1 - \alpha)^2 X_{t-2} + \cdots

其中 α(0,1)\alpha \in (0, 1) 是平滑系数. 对于变化缓慢的序列, 常取较小的 α\alpha; 对于变化迅速的序列, 常取较大的 α\alpha. 经验 α\alpha 常介于 0.050.050.30.3 之间.

6.3.2 Holt 两参数指数平滑

  Holt 两参数指数平滑可以拟合有线性趋势但无季节效应的序列. 即假定序列 XtX_t 满足

Xt=a+bt+εt,εti.i.dN(0,σ2)X_t = a + b t + \varepsilon _t, \qquad \varepsilon _t \overset{\text{i.i.d}}{\sim} N(0, \sigma^2)

它可以等价写成

Xt=(Xt1εt1at1)+(b+εtbt)=at1+btX_t = (\underbrace{X_{t-1} - \varepsilon _{t-1}}_{a_{t-1}}) + (\underbrace{b + \varepsilon _t}_{b_t}) = a_{t-1} + b_t

预测模型为

a^t+1=αXt+(1α)(a^t+b^t)b^t+1=β(a^t+1a^t)+(1β)b^t\begin{aligned} \hat a_{t+1} & = \alpha X_t + (1 - \alpha)(\hat a_t + \hat b_t)\\ \hat b_{t+1} & = \beta (\hat a_{t+1} - \hat a_t) + (1 - \beta) \hat b_t \end{aligned}

向前 kk 期预测值为

X^t+k=a^t+kb^t\hat X _{t+k} = \hat a_t + k \hat b_t

6.3.3 Holt-Winters 三参数指数平滑

  Holt-Winters 三参数指数平滑可以拟合有线性趋势和季节效应的序列.

加法模型 即假定序列 XtX_t 满足

Xt=a+bt+ct+εt,εti.i.dN(0,σ2)X_t = a + b t + c_t + \varepsilon _t, \qquad \varepsilon _t \overset{\text{i.i.d}}{\sim} N(0, \sigma^2)

其中 ct=Sj+et,eti.i.dN(0,σe2)c_t = S_j + e_t, e_t \overset{\text{i.i.d}}{\sim} N(0, \sigma _e^2) 是季节效应. 它可以等价写成

Xt=(Xt1ct1εt1at1)+(b+εtbt)+(Sj+etct)=at1+bt+ctX_t = (\underbrace{X_{t-1} - c_{t-1} - \varepsilon _{t-1}}_{a_{t-1}}) + (\underbrace{b + \varepsilon _t}_{b_t}) + (\underbrace{S_j + e_t}_{c_t}) = a_{t-1} + b_t + c_t

预测模型为

a^t+1=α(Xt+1ct+1m)+(1α)(a^t+b^t)b^t+1=β(a^t+1a^t)+(1β)b^tc^t+1=γ(Xt+1a^t+1)+(1γ)ct+1m\begin{aligned} \hat a_{t+1} & = \alpha (X_{t+1} - c_{t+1-m}) + (1 - \alpha)(\hat a_t + \hat b_t)\\ \hat b_{t+1} & = \beta (\hat a_{t+1} - \hat a_t) + (1 - \beta) \hat b_t\\ \hat c_{t+1} & = \gamma (X_{t+1} - \hat a_{t+1}) + (1 - \gamma) c_{t+1-m} \end{aligned}

其中 mm 是周期长度. 向前 kk 期预测值为

X^t+k=a^t+kb^t+c^t+k\hat X _{t+k} = \hat a_t + k \hat b_t + \hat c_{t+k}

其中 c^t+k=S^j\hat c_{t+k} = \hat S_{j}, jj 是第 t+kt+k 期的季节序号.

乘法模型 即假定序列 XtX_t 满足

Xt=(a+bt+εt)ct,εti.i.dN(0,σ2)X_t = (a + b t + \varepsilon _t) c_t, \qquad \varepsilon _t \overset{\text{i.i.d}}{\sim} N(0, \sigma^2)

它可以等价写成

Xt=((Xt1/ct1εt1at1)+(b+εtbt))(Sj+etct)=(at1+bt)ctX_t = \Big((\underbrace{X_{t-1} / c_{t-1} - \varepsilon _{t-1}}_{a_{t-1}}) + (\underbrace{b + \varepsilon _t}_{b_t})\Big) (\underbrace{S_j + e_t}_{c_t}) = (a_{t-1} + b_t) c_t

预测模型为

a^t+1=α(Xt+1/ct+1m)+(1α)(a^t+b^t)b^t+1=β(a^t+1a^t)+(1β)b^tc^t+1=γ(Xt+1/a^t+1)+(1γ)ct+1m\begin{aligned} \hat a_{t+1} & = \alpha (X_{t+1} / c_{t+1-m}) + (1 - \alpha)(\hat a_t + \hat b_t)\\ \hat b_{t+1} & = \beta (\hat a_{t+1} - \hat a_t) + (1 - \beta) \hat b_t\\ \hat c_{t+1} & = \gamma (X_{t+1} / \hat a_{t+1}) + (1 - \gamma) c_{t+1-m} \end{aligned}

向前 kk 期预测值为

X^t+k=(a^t+kb^t)c^t+k\hat X _{t+k} = (\hat a_t + k \hat b_t) \hat c_{t+k}

其中 c^t+k=S^j\hat c_{t+k} = \hat S_{j}, jj 是第 t+kt+k 期的季节序号.

6.4 ARIMA 加法模型

  ARIMA 模型也可以用于提取季节效应. 它的模型结构是

SdXt=Θ(B)Φ(B)εt\nabla _S \nabla ^d X_t = \frac{\Theta(\mathrm B)}{\Phi(\mathrm B)} \varepsilon _t

其中 SS 是周期步长. 该加法模型可以记为 ARIMA(p,d,q)×(0,1,0)S\mathrm{ARIMA}(p, d, q) \times (0, 1, 0)_S.

6.5 ARIMA 乘法模型

  ARIMA 加法模型的季节因素仅是加法关系. 考虑带有乘法关系的 ARIMA 乘法模型, 它是基于单一观测值的 ARIMA(p,d,q)\mathrm{ARIMA}(p, d, q) 模型和基于周期观测值的 ARIMA(P,D,Q)\mathrm{ARIMA}(P, D, Q) 模型的复合. 它的模型结构是

SDdXt=Θ(B)Φ(B)ΘS(B)ΦS(B)εt\nabla _S^D \nabla ^d X_t = \frac{\Theta(\mathrm B)}{\Phi(\mathrm B)} \frac{\Theta _S(\mathrm B)}{\Phi _S(\mathrm B)} \varepsilon _t

该乘法模型可以记为 ARIMA(p,d,q)×(P,D,Q)S\mathrm{ARIMA}(p, d, q) \times (P, D, Q)_S. 其中

ΦS(B)=1φ1BSφPBPS,ΘS(B)=1θ1BSθQBQS\Phi _S(\mathrm B) = 1 - \varphi' _1 \mathrm B^S - \cdots - \varphi' _P \mathrm B^{PS}, \qquad \Theta _S(\mathrm B) = 1 - \theta' _1 \mathrm B^S - \cdots - \theta' _Q \mathrm B^{QS}

在模型定阶时, 基础部分的 ARIMA 模型考虑 1,2,1, 2, \dots 阶 ACF 和 PACF; 周期部分的 ARIMA 模型考虑 S,2S,S, 2S, \dots 阶 ACF 和 PACF. 考虑 dd 阶差分可以消除趋势, 考虑 SSDD 阶差分可以消除季节效应及其趋势.