跳到主要内容

《应用时间序列分析》笔记(第一部分:ARMA 模型及其性质)

1 时间序列分析简介

1.2 时间序列的定义

时间序列随机变量及其实现 使用按时间顺序排列的一个随机变量族 {X1,X2,,Xn}\{X_1, X_2, \dots, X_n\} 来表示一个时间序列, 简记为 {Xt}tT\{X_t\}_{t \in T}, 其中时间下标 T={1,,n}T = \{1, \dots, n\}. 用 {x1,x2,,xn}\{x_1, x_2, \dots, x_n\} 表示该随机序列变量的 nn 个观测值, 有时也称为一个实现.

时间序列的概率分布族 时间序列有时可以是一个无穷序列 {X1,X2,}\{X_1, X_2, \dots\}, 难以用联合分布的方式定义概率分布. 但是可以定义它每一个非平凡有限子集的分布

{Ft1,,tm(x1,,xm):mZ+,{t1,,tm}2T}\{F_{t_1, \dots, t_m}(x_1, \dots, x_m): m \in \mathbb Z_+, \{t_1, \dots, t_m\} \in 2^T\}

将这些有限维分布构成的全体称为 {Xt}\{X_t\} 的概率分布族.

数字特征 时间序列 {Xt}\{X_t\} 有以下常用数字特征:

  • 均值μt:=EXt=+xdFt(x)\mu_t := \mathrm EX_t = \int _{-\infty}^{+\infty} x \mathrm dF_t(x).

  • 方差σt2:=DXt=E(Xtμt)2\sigma ^2_t := \mathrm DX_t = E(X_t - \mu_t)^2.

  • 自协方差系数 (ACVF, auto-covariance function) 任取 t,sTt, s \in T, 定义它们的 ACVF 为

γ(t,s):=Cov(Xt,Xs)=E(Xtμt)(Xsμs)\gamma(t, s) := \mathrm{Cov}(X_t, X_s) = \mathrm E(X_t - \mu _t)(X_s - \mu _s)
  • 自相关系数 (ACF, auto-correlation function) 任取 t,sTt, s \in T, 定义它们的 ACF 为
ρ(t,s):=Corr(Xt,Xs)=Cov(Xt,Xs)DXtDXs\rho(t, s) := \mathrm{Corr}(X_t, X_s) = \frac{\mathrm{Cov}(X_t, X_s)}{\sqrt{\mathrm DX_t \mathrm DX_s}}
  • 偏自相关系数 (PACF, partial auto-correlation function) 任取 t,sTt, s \in T (不妨 tst \leq s), 定义它们的 PACF 为给定中间序列值后的条件 ACF.
ρ(t,s):=Corr(Xt,Xs{Xτ}τ=t+1s1)\partial \rho(t, s) := \mathrm{Corr}(X_t, X_s \mid \mathcal \{X_\tau\}_{\tau=t+1}^{s-1})

2 时间序列的预处理

2.1 平稳序列的定义

严平稳性 即时间序列所有矩具有平移不变性, 等价于时间序列的分布函数具有平移不变性. 给定时间序列 {Xt}t=1n\{X_t\}_{t=1}^n, 若任取其有限子集 t1,,tmTt_1, \dots, t_m \in T, 任取时间间隔 kk, 都有

Ft1,,tm(x1,,xm)=Ft1+k,,tm+k(x1,,xm)F_{t_1, \dots, t_m}(x_1, \dots, x_m) = F_{t_1+k, \dots, t_m+k}(x_1, \dots, x_m)

则称该时间序列具有严平稳性 (strictly stationary).

(宽)平稳性 即时间序列直到二阶矩具有平移不变性. (宽)平稳性是严平稳性的放宽, 它仅需要保证序列直到二阶矩平稳. 给定时间序列 {Xt}t=1n\{X_t\}_{t=1}^n, 若

  • 一阶矩平稳, 即均值恒定. μtμ\mu _t \equiv \mu.

  • 自身二阶矩平稳, 即方差恒定. σt2σ2\sigma ^2 _t \equiv \sigma ^2.

  • 交叉二阶矩平稳, 即 ACVF (等价于 ACF) 仅与时间间隔有关.

t,s,kN,γ(t,s)=γ(t+k,s+k)\forall t, s, \forall k \in \mathbb N, \quad \gamma(t, s) = \gamma(t + k, s + k)

则称该时间序列具有宽平稳性 (weak stationary). 此时 ACVF 和 ACF 可以写成时间间隔的函数 γk\gamma _kρk\rho _k.

样本 ACVF 和样本 ACF 给定一个平稳时间序列 {xt}t=1n\{x_t\}_{t=1}^n, 可以计算它的样本 ACVF 和样本 ACF

γ^k=1nkt=1nk(xtxˉ)(xt+kxˉ),ρ^k=γ^kγ^0\hat \gamma _k = \frac{1}{n-k} \sum_{t=1}^{n-k} (x_t - \bar x) (x_{t+k} - \bar x), \qquad \hat \rho _k = \frac{\hat \gamma _k}{\hat \gamma _0}

它们可以作为 ACVF 和 ACF 的估计.

PACF 的计算 对于一个中心化平稳时间序列 {Xt}\{X_t\}, PACF 也仅与时间间隔有关, 所以也可以写成时间间隔的函数 ρk\partial \rho _k. 考虑用历史 kk 期序列值对 XtX_t 做简单线性回归

Xt=φk1Xt1++φkkXtk+εtX_t = \varphi _{k1} X_{t-1} + \cdots + \varphi _{kk} X_{t-k} + \varepsilon _t

在获得 (φk1,,φkk)(\varphi _{k1}, \dots, \varphi _{kk}) 的最小二乘估计值后, 给定中间的序列值 {Xτ}τ=tk+1t1\{X_\tau\}_{\tau=t-k+1}^{t-1}, 此时 XtX_tXtkX_{t-k} 的拟合值和真实值分别满足

{X^t=φk1Xt1++φkkX^tkXt=φk1Xt1++φkkXtk+εt\left\{ \begin{aligned} \hat X_t & = \varphi _{k1} X_{t-1} + \cdots + \varphi _{kk} \hat X_{t-k}\\ X_t & = \varphi _{k1} X_{t-1} + \cdots + \varphi _{kk} X_{t-k} + \varepsilon _t \end{aligned} \right.

两式相减可以得到

XtX^t=φkk(XtkX^tk)+εtX_t - \hat X_t = \varphi _{kk} (X_{t-k} - \hat X_{t-k}) + \varepsilon _t

φkk\varphi _{kk} 等于两个残差的相关系数, 这正是 PACF 的定义.

φkk=Corr(XtX^t,XtkX^tk)=Corr(Xt,Xtk{Xτ}τ=tk+1t1)=ρk\begin{aligned} \varphi _{kk} & = \mathrm{Corr}(X_t - \hat X_t, X_{t-k} - \hat X_{t-k})\\ & = \mathrm{Corr}(X_t, X_{t-k} \mid \{X_\tau\}_{\tau=t-k+1}^{t-1}) = \partial \rho _k \end{aligned}

Yule-Walker 方程组 Yule-Walker 方程组描述了 ACF 与 PACF 之间的关系. 给定中心化平稳时间序列 {Xt}\{X_t\}, 有 E(XtXs)/σ2=ρst\mathrm E(X_t X_s) / \sigma^2 = \rho _{s - t}. 所以在

Xt=φk1Xt1++φkkXtk+εtX_t = \varphi _{k1} X_{t-1} + \cdots + \varphi _{kk} X_{t-k} + \varepsilon _t

对于 {1,,k}\ell \in \{1, \dots, k\}, 等号两侧同乘 EXt\mathrm EX_{t-\ell} 可以得到 Yule-Walker 方程组

{ρ1=φk1ρ0+φk2ρ1+φkkρk1ρ2=φk1ρ1+φk2ρ0+φkkρk2ρk=φk1ρk1+φk2ρk2+φkkρ0\left\{ \begin{aligned} & \rho _1 = \varphi _{k1} \rho _0 + \varphi _{k2} \rho _1 + \cdots \varphi _{kk} \rho _{k-1}\\ & \rho _2 = \varphi _{k1} \rho _1 + \varphi _{k2} \rho _0 + \cdots \varphi _{kk} \rho _{k-2}\\ & \cdots\\ & \rho _k = \varphi _{k1} \rho _{k-1} + \varphi _{k2} \rho _{k-2} + \cdots \varphi _{kk} \rho _0 \end{aligned} \right.

它的矩阵形式是

(1ρ1ρk1ρ11ρk2ρk1ρk21)(φk1φk2φkk)=(ρ1ρ2ρk)\begin{pmatrix} 1 & \rho _1 & \cdots & \rho _{k-1}\\ \rho _1 & 1 & \cdots & \rho _{k-2}\\ \vdots & \vdots & \ddots & \vdots\\ \rho _{k-1} & \rho _{k-2} & \cdots & 1 \end{pmatrix} \begin{pmatrix} \varphi _{k1}\\ \varphi _{k2}\\ \vdots\\ \varphi _{kk} \end{pmatrix} = \begin{pmatrix} \rho _1\\ \rho _2\\ \vdots\\ \rho _k \end{pmatrix}

由 Cramer 法则可以得到 PACF 的显式解

φkk=1ρ1ρ1ρ11ρ2ρk1ρk2ρk/1ρ1ρk1ρ11ρk2ρk1ρk21\varphi _{kk} = \begin{vmatrix} 1 & \rho _1 & \cdots & \rho _1\\ \rho _1 & 1 & \cdots & \rho _2\\ \vdots & \vdots & \ddots & \vdots\\ \rho _{k-1} & \rho _{k-2} & \cdots & \rho _k \end{vmatrix} \Bigg/ \begin{vmatrix} 1 & \rho _1 & \cdots & \rho _{k-1}\\ \rho _1 & 1 & \cdots & \rho _{k-2}\\ \vdots & \vdots & \ddots & \vdots\\ \rho _{k-1} & \rho _{k-2} & \cdots & 1 \end{vmatrix}

分子是系数矩阵的行列式, 分母是将系数矩阵最后一列换成 ACF 向量得到的矩阵的行列式.

2.2 平稳性检验

  时间序列的平稳性可以从时序图看出, 但是仅适用于趋势或周期比较明显的序列. 否则应该使用单位根检验法. 单位根检验见 4.2 节.

  不平稳的成因可能是有趋势、有季节波动、有异方差性或有单位根等. 有单位根的时间序列一定非平稳 (称为单位根非平稳). 但有的时间序列具有季节波动, 即使它没有单位根, 它也不平稳.

2.3 纯随机性检验

  若一个平稳时间序列的交叉二阶矩为零, 即对于时间序列 {Xt}\{X_t\},

EXtμ,DXtσ2,γ(k)0,k1\mathrm EX_t \equiv \mu, \qquad \mathrm DX_t \equiv \sigma^2, \qquad \gamma(k) \equiv 0, \forall k \geq 1

则称该时间序列为纯随机序列, 也称为白噪声 (white noise) 序列, 记为 XtWN(μ,σ2)X_t \sim \mathrm{WN}(\mu, \sigma^2).

注 白噪声分布不是一族分布, 即它的参数 μ,σ2\mu, \sigma ^2 并不足以确定它的分布函数. 它可能是独立同分布的正态变量 Xti.i.dN(μ,σ2)X_t \overset{\text{i.i.d}}{\sim} N(\mu, \sigma^2), 也可能是独立同分布的均匀分布变量 Xti.i.dU(μ3σ,μ+3σ)X_t \overset{\text{i.i.d}}{\sim} U(\mu - \sqrt 3 \sigma, \mu + \sqrt 3 \sigma), 甚至可能 tt 为奇偶数时各自服从相互同均值同方差且线性无关的的正态分布和均匀分布.

单一 ACF 是否为零的 tt 检验 有时我们需要检验某一个 ACF 是否为零. 给定时间间隔 kZ+k \in \mathbb Z_+, 考虑假设检验

H0:ρk=0,H1:ρk0H_0: \rho _k = 0, \qquad H_1: \rho _k \neq 0

考虑 tt 检验

t=ρ^k(1+2i=1k1ρ^i2)/n˙StdNt = \frac{\hat \rho _k}{\sqrt{\Big(1 + 2 \sum_{i=1}^{k-1} \hat \rho _i^2\Big) \big/ n}} \mathop{\dot \sim} \mathrm{Std}N

所有 ACF 是否均为零的 Ljung-Box 纯随机性检验 有时我们需要检验所有 ACF 是否均为零, 但这是困难的. 我们可以检验时间序列是否直到 mm 阶 ACF 为零.

H0:ρ1==ρm=0,H1:ρi0,imH_0: \rho _1 = \cdots = \rho _m = 0, \qquad H_1: \rho _i \neq 0, \exists i \leq m

考虑 Ljung-Box 纯随机性检验

Q=n(n+2)i=1mρ^i2ni˙χ2(m)Q = n(n + 2) \sum _{i=1}^m \frac{\hat \rho _i^2}{n - i} \mathop{\dot \sim} \chi^2(m)

  mm 的选择不应过大. 一方面若时间序列短期不自相关, 长期就更不会自相关. 另一方面考虑延迟期数太长反而可能淹没短期自相关性.

3 ARMA 模型的性质

3.1  Wold 分解定理

  时间序列分析的全部理论基础依赖于 Wold 分解定理.

Wold 分解定理 任一离散平稳时间序列都可以分解为两个不相关平稳过程之和, 一个是确定性的 (deterministic), 一个是随机性的 (stochastic). 即

Xt=Vt+ξtX_t = V_t + \xi _t

确定性时间序列 确定性时间序列可以表示为历史序列值的线性组合. 即

Vt=φ1Xt1+φ2Xt2+V_t = \varphi _1 X_{t-1} + \varphi _2 X_{t-2} + \cdots

其中 (φ1,φ2,)(\varphi _1, \varphi _2, \dots) 是待估参数. 它实际上就是自回归 (AR, auto-regressive) 模型, 由 Yule 于 1927 年提出.

随机时间序列 随机时间序列可以表达为白噪音的线性组合. 即

ξt=εtθ1εt1θ2εt2\xi _t = \varepsilon _t - \theta _1 \varepsilon _{t-1} - \theta _2 \varepsilon _{t-2} - \cdots

其中 εt\varepsilon _t 是时刻 tt 对应的白噪音值, (θ1,θ2,)(\theta _1, \theta _2, \dots) 是待估参数. {εt}\{\varepsilon _t\} 称为新息过程 (innovation process), 是每个时期加入的新随机信息. 它实际上就是移动平均 (MA, moving average) 模型, 由 Walker 于 1931 年提出.

一般的平稳时间序列 将可预测时间序列与不可预测时间序列叠加, 将 VtV_tξt\xi _t 的方程代入 Wold 分解定理, 可以得到

Xtφ1Xt1φ2Xt2=εtθ1εt1θ2εt2X_t - \varphi _1 X_{t-1} - \varphi _2 X_{t-2} - \cdots = \varepsilon _t - \theta _1 \varepsilon _{t-1} - \theta _2 \varepsilon _{t-2} - \cdots

延迟算子 可以引入延迟算子 B\mathrm B 以化简 BkXt:=Xtk\mathrm B^k X_t := X_{t-k}Bkεt:=εtk\mathrm B^k \varepsilon _t := \varepsilon _{t-k}, 于是上式可以简记作

(1φ1Bφ2B2Φ(B))Xt=(1θ1Bθ2B2Θ(B))εt(\underbrace{1 - \varphi _1 \mathrm B - \varphi _2 \mathrm B^2 - \cdots} _{\Phi(\mathrm B)}) X_t = (\underbrace{1 - \theta _1 \mathrm B - \theta _2 \mathrm B^2 - \cdots} _{\Theta(\mathrm B)}) \varepsilon _t

或形式上

Φ(B)Xt=Θ(B)εt,Xt=Φ(B)Θ(B)εt\Phi(\mathrm B) X_t = \Theta(\mathrm B) \varepsilon _t, \qquad X_t = \frac{\Phi(\mathrm B)}{\Theta(\mathrm B)} \varepsilon _t

根据 Wold 分解定理, 任一平稳时间序列都可以写成 Xt=Θ(B)Φ(B)εtX_t=\frac{\Theta(B)}{\Phi(B)}\varepsilon _t 的形式.

3.2 AR 模型

3.2.1 AR 模型的定义

  pp 阶 AR 模型具有如下结构:

{Xt=φ0+φ1Xt1++φpXtp+εt,φp0εtWN(0,σε2),Xsεt,s<t\left\{ \begin{aligned} & X_t = \varphi _0 + \varphi _1 X_{t-1} + \cdots + \varphi _p X_{t-p} + \varepsilon _t, \quad \varphi _p \neq 0\\ & \varepsilon _t \sim \mathrm{WN}(0, \sigma _\varepsilon ^2), \quad X_s \perp \varepsilon _t, \forall s < t \end{aligned} \right.

AR 模型的中心化 考虑中心化 XtXtφ0/(1φ1φp)X_t \gets X_t - \varphi _0 / (1 - \varphi _1 - \cdots - \varphi _p) 就能使 φ0=0\varphi _0 = 0. 以下分析序列值之间相关关系时, 一般简化为分析中心化模型.

3.2.2 AR 模型的平稳性判别

特征根判别 一个 AR(p)\mathrm{AR}(p) 模型

Xtφ1Xt1φpXtp=φ0+εtX_t - \varphi _1 X_{t-1} - \cdots - \varphi _p X_{t-p} = \varphi _0 + \varepsilon _t

对应的特征方程是

λpφ1λp1φp=0\lambda^p - \varphi _1 \lambda^{p-1} - \cdots - \varphi _p = 0

该模型平稳当且仅当它特征方程的 pp 个根都在单位圆内.

  它也可以用延迟算子写成

(1φ1Bφ2B2Φ(B))Xt=φ0+εt(\underbrace{1 - \varphi _1 \mathrm B - \varphi _2 \mathrm B^2 - \cdots} _{\Phi(\mathrm B)}) X_t = \varphi _0 + \varepsilon _t

其中

Φ(λ)=1φλφpλp\Phi(\lambda) = 1 - \varphi \lambda - \cdots - \varphi _p \lambda^p

是其系数多项式. 该模型平稳也当且仅当它系数多项式的 pp 个根都在单位圆外. 注意特征方程的根与系数多项式的根互为倒数.

平稳域判别 从特征根判别法可以反推各 φ\varphi 的取值范围. 例如 AR(1)\mathrm{AR}(1) 模型的平稳域是 1<φ1<1-1 < \varphi _1 < 1; AR(2)\mathrm{AR}(2) 模型的平稳域是参数 (φ1,φ2)(\varphi _1, \varphi _2) 位于点 {(0,1),(2,1),(2,1)}\{(0, 1), (2, -1), (-2, -1)\} 构成的三角区域中.

3.2.3 平稳 AR 模型的统计性质

均值 将 AR 模型两边取均值即可解得

μ=φ01φ1φp\mu = \frac{\varphi _0}{1 - \varphi _1 - \cdots - \varphi _p}

AR(1)\mathrm{AR}(1) 模型可以直观理解. 在 AR(1)\mathrm{AR}(1) 模型中,

Xt=φ0+φ1Xt1+εtX_t = \varphi _0 + \varphi _1 X_{t-1} + \varepsilon _t

可以重写为

XtXt1=(1φ1)(Xt1μ)+εtX_t - X_{t-1} = -(1 - \varphi _1)(X_{t-1} - \mu) + \varepsilon _t

注意到 1φ1<01 - \varphi _1 < 0, 所以该式可以解释为“本期与上期差值”与“上期值至均值的距离”负相关.

  • 若上期值高于均值, 则本期值有向下的趋势.
  • 若上期值低于均值, 则本期值有向上的趋势.

总而言之, 本期值总是有“被拉回均值”的趋势, 即该序列是均值回归的. 该趋势的高低由“上期值偏离均值的距离”和“φ1\varphi _1 的值”共同决定.

  • φ1>0\varphi _1 > 0, 则本期值“只会拉回一点点”.
  • φ1=0\varphi _1 = 0, 则本期值“会拉到恰好均值的位置”, 从而成为随机模型 Xt=φ0+εtX_t = \varphi _0 + \varepsilon _t.
  • φ1<0\varphi _1 < 0, 则本期值“会拉到均值的另一侧”.

Green 函数AR(p)\mathrm{AR}(p) 模型可以写成 MA()\mathrm{MA}(\infty) 模型的形式. 即

Xt=φ1Xt1++φpXtp+εtX_t = \varphi _1 X_{t-1} + \cdots + \varphi _p X_{t-p} + \varepsilon _t

可以迭代地完全展开成 {εt}\{\varepsilon _t\} 的线性组合的形式. 考虑 Green 函数 G()G_{(\cdot)} 是线性组合的系数

Xt=G0εt+G1εt1++Gt1ε1X_t = G_0 \varepsilon _t + G_1 \varepsilon _{t-1} + \cdots + G_{t-1} \varepsilon _1

Green 函数之间的递推公式为

Gk={1,k=0φ1Gk1++φkG0,k=1,,pφ1Gk1++φpGkp,k=p+1,G_k = \begin{cases} 1, \quad & k = 0\\ \varphi _1 G_{k-1} + \cdots + \varphi _k G_0, \quad & k = 1, \dots, p\\ \varphi _1 G_{k-1} + \cdots + \varphi _p G_{k-p}, \quad & k = p+1, \dots\\ \end{cases}

 考虑平稳中心化 AR(1)\mathrm{AR}(1) 模型 Xt=φ1Xt1+εtX_t = \varphi _1 X_{t-1} + \varepsilon _t. 我们假设小于 11 时刻的序列值不存在, 即 X0=0X_0 = 0, 则可以迭代地展开

Xt=εt+φ1Xt1=εt+φ1(φ1Xt2+εt1)=εt+φ1εt1+φ12Xt2==εt+φ1εt1+φ12εt2++φ1t1X1\begin{aligned} X_t & = \varepsilon _t + \varphi _1 X_{t-1} = \varepsilon _t + \varphi _1 (\varphi _1 X_{t-2} + \varepsilon _{t-1})\\ & = \varepsilon _t + \varphi _1 \varepsilon _{t-1} + \varphi _1^2 X_{t-2} = \cdots\\ & = \varepsilon _t + \varphi _1 \varepsilon _{t-1} + \varphi _1^2 \varepsilon _{t-2} + \cdots + \varphi _1^{t-1} X_1 \end{aligned}

比对可以得到 Green 函数的值

Gk=φ1kG_k = \varphi _1 ^k

 尝试求解平稳 AR(2)\mathrm{AR}(2) 模型 Xt=φ1Xt1+φ2Xt2+εtX_t = \varphi _1 X_{t-1} + \varphi _2 X_{t-2} + \varepsilon _t 的 Green 函数. 递推公式为

G0=1,G1=φ1,Gk=φ1Gk1+φ2Gk2,k2G_0 = 1, \qquad G_1 = \varphi _1, \qquad G_k = \varphi _1 G_{k-1} + \varphi _2 G_{k-2}, \forall k \geq 2

Green 函数的特征方程是

λ2=φ1λφ2\lambda^2 = \varphi _1 \lambda - \varphi _2

它的根为 λ1,2=(φ1±φ124φ2)/2\lambda _{1, 2} = (\varphi _1 \pm \sqrt{\varphi _1^2 - 4 \varphi _2})/2. 考虑限定递推数列解的结构和初值, 可以得到 Green 函数为

Gk=12(φ1+φ124φ22)k+12(φ1φ124φ22)kG_k = \frac 12 \left(\frac{\varphi _1 + \sqrt{\varphi _1^2 - 4 \varphi _2}}{2}\right) ^k + \frac 12 \left(\frac{\varphi _1 - \sqrt{\varphi _1^2 - 4 \varphi _2}}{2}\right) ^k

方差 对时间序列进行 Green 函数展开后两边取方差, 可以得到

σ2=(G02+G12+)σε2\sigma ^2 = (G_0^2 + G_1^2 + \cdots) \sigma _\varepsilon ^2

 计算平稳 AR(1)\mathrm{AR}(1) 模型 Xt=φ1Xt1+εtX_t = \varphi _1 X_{t-1} + \varepsilon _t 的方差. 使用平凡方法, 两边取方差可以得到

σ2=φ12σ2+σε2    σ2=σε21φ12\sigma ^2 = \varphi _1^2 \sigma ^2 + \sigma _\varepsilon ^2 \implies \sigma ^2 = \frac{\sigma _\varepsilon ^2}{1 - \varphi _1 ^2}

也可以直接使用 Green 函数

σ2=(1+φ12+φ14+)σε2=σε21φ12\sigma ^2 = (1 + \varphi _1^2 + \varphi _1^4 + \cdots) \sigma _\varepsilon ^2 = \frac{\sigma _\varepsilon ^2}{1 - \varphi _1 ^2}

 尝试求解平稳 AR(2)\mathrm{AR}(2) 模型 Xt=φ1Xt1+φ2Xt2+εtX_t = \varphi _1 X_{t-1} + \varphi _2 X_{t-2} + \varepsilon _t 的方差. 无需求解 Green 函数的具体数值. 记 A=k=0Gk2A = \sum _{k=0} ^\infty G_k^2, B=k=0GkGk+1B = \sum _{k=0} ^\infty G_k G_{k+1}. 分别展开

A=k=0Gk2=1+φ12+k=2(φ1Gk1+φ2Gk2)2=1+φ12+φ12k=2Gk12+φ22k=2Gk22+2φ1φ2k=2Gk1Gk2=1+φ12k=0Gk2+φ22k=0Gk2+2φ1φ2k=0GkGk+1=1+(φ12+φ22)A+2φ1φ2B\begin{aligned} A = \sum _{k=0} ^\infty G_k^2 & = 1 + \varphi _1^2 + \sum _{k=2} ^\infty (\varphi _1 G_{k-1} + \varphi _2 G_{k-2})^2\\ & = 1 + \varphi _1^2 + \varphi _1^2 \sum _{k=2} ^\infty G_{k-1}^2 + \varphi _2^2 \sum _{k=2} ^\infty G_{k-2}^2 + 2\varphi _1\varphi _2 \sum _{k=2} ^\infty G_{k-1} G_{k-2}\\ & = 1 + \varphi _1^2 \sum _{k=0} ^\infty G_k^2 + \varphi _2^2 \sum _{k=0} ^\infty G_k^2 + 2\varphi _1\varphi _2 \sum _{k=0} ^\infty G_k G_{k+1}\\ & = 1 + (\varphi _1^2 + \varphi _2^2) A + 2\varphi _1\varphi _2 B\\ \end{aligned}

以及

B=k=0GkGk+1=G0G1+k=1Gk(φ1Gk+φ2Gk1)=φ1+φ1k=1Gk2+φ2k=1Gk1Gk=φ1k=0Gk2+φ2k=0GkGk+1=φ1A+φ2B\begin{aligned} B = \sum _{k=0} ^\infty G_k G_{k+1} & = G_0G_1 + \sum _{k=1} ^\infty G_k (\varphi _1 G_k + \varphi _2 G_{k-1})\\ & = \varphi _1 + \varphi _1 \sum _{k=1} ^\infty G_k^2 + \varphi _2 \sum _{k=1} ^\infty G_{k-1} G_k\\ & = \varphi _1 \sum _{k=0} ^\infty G_k^2 + \varphi _2 \sum _{k=0} ^\infty G_k G_{k+1} = \varphi _1 A + \varphi _2 B \end{aligned}

这样就得到了一对关于 AABB 的二元一次方程组. 可以解得

A=1φ2(1+φ2)(1φ1φ2)(1+φ1φ2)A = \frac{1 - \varphi _2}{(1 + \varphi _2)(1 - \varphi _1 - \varphi _2)(1 + \varphi _1 - \varphi _2)}

AR(2)\mathrm{AR}(2) 的方差正是 σ2=k=0Gk2σε2=Aσε2\sigma ^2 = \sum _{k=0} ^\infty G_k^2 \sigma _\varepsilon ^2 = A \sigma _\varepsilon ^2.

ACVF 对平稳 AR(p)\mathrm{AR}(p) 模型两边同乘 XtkX_{t-k} 然后取期望, 可以得到

EXtXtk=φ1EXt1Xtk++φpEXtpXtk+εt\mathrm EX_tX_{t-k} = \varphi _1 \mathrm EX_{t-1}X_{t-k} + \cdots + \varphi _p \mathrm EX_{t-p}X_{t-k} + \varepsilon _t

所以 ACVF 有递推式

γk=φ1γk1++φpγkp\gamma _k = \varphi _1 \gamma _{k-1} + \cdots + \varphi _p \gamma _{k-p}

 计算平稳 AR(1)\mathrm{AR}(1) 模型的 ACVF. 使用平凡方法

γk=Cov(Xt,Xt+k)=Cov(Xt,φ1Xt+k1+εt+k+1)=φ1γk1\gamma _k = \mathrm{Cov}(X_t, X_{t+k}) = \mathrm{Cov}(X_t, \varphi _1 X_{t+k-1} + \varepsilon _{t+k+1}) = \varphi _1 \gamma _{k-1}

也可以得到递推式

γk=φ1γk1=φ12γk2==φ1kγ0=φ1kσε21φ12\gamma _k = \varphi _1 \gamma _{k-1} = \varphi _1^2 \gamma _{k-2} = \cdots = \varphi _1^k \gamma _0 = \frac{\varphi _1^k \sigma _\varepsilon ^2}{1 - \varphi _1 ^2}

 尝试求解平稳 AR(2)\mathrm{AR}(2) 模型的 ACVF. 考虑递推式

γk=φ1γk1+φ2γk2\gamma _k = \varphi _1 \gamma _{k-1} + \varphi _2 \gamma _{k-2}

特殊地取 k=1k=1 时有 γ1=φ1γ0+φ2γ1\gamma _1 = \varphi _1 \gamma _0 + \varphi _2 \gamma _1 所以 AR(2)\mathrm{AR}(2) 的 ACVF 有递推式

γ0=σ2,γ1=φ1σ21φ2,γk=φ1γk1+φ2γk2\gamma _0 = \sigma ^2, \qquad \gamma _1 = \frac{\varphi _1 \sigma ^2}{1 - \varphi _2}, \qquad \gamma _k = \varphi _1 \gamma _{k-1} + \varphi _2 \gamma _{k-2}

ACF ACF 有与 ACVF 相同的递推式

ρk=φ1ρk1++φpρkp\rho _k = \varphi _1 \rho _{k-1} + \cdots + \varphi _p \rho _{k-p}

ACF 有两个显著性质, 一是拖尾性, 二是呈指数衰减.

 平稳 AR(1)\mathrm{AR}(1) 模型的 ACF 是 ρk=φ1k\rho _k = \varphi _1^k, 平稳 AR(2)\mathrm{AR}(2) 模型 ACF 的递推式是

ρ0=1,ρ1=φ11φ2,ρk=φ1ρk1+φ2ρk2\rho _0 = 1, \qquad \rho _1 = \frac{\varphi _1}{1 - \varphi _2}, \qquad \rho _k = \varphi _1 \rho _{k-1} + \varphi _2 \rho _{k-2}

PACF PACF 可以使用 Yule-Walker 方程组求解.

(1ρ1ρk1ρ11ρk2ρk1ρk21)(φk1φk2φkk)=(ρ1ρ2ρk)\begin{pmatrix} 1 & \rho _1 & \cdots & \rho _{k-1}\\ \rho _1 & 1 & \cdots & \rho _{k-2}\\ \vdots & \vdots & \ddots & \vdots\\ \rho _{k-1} & \rho _{k-2} & \cdots & 1 \end{pmatrix} \begin{pmatrix} \varphi _{k1}\\ \varphi _{k2}\\ \vdots\\ \varphi _{kk} \end{pmatrix} = \begin{pmatrix} \rho _1\\ \rho _2\\ \vdots\\ \rho _k \end{pmatrix}

PACF 有 pp 阶截尾性: 从 p+1p+1 阶开始的 PACF 均为零. 这是因为 Yule-Walker 方程组对 φkk\varphi _{kk} 使用 Cramer 法则求解时的分子行列式为零.

 在 Yule-Walker 方程组中取 k=1k=1k=2k=2 可以得到

φ11=ρ1,φ22=ρ2ρ121ρ12\varphi _{11} = \rho _1, \qquad \varphi _{22} = \frac{\rho _2 - \rho _1^2}{1 - \rho _1^2}

所以平稳 AR(1)\mathrm{AR}(1) 模型的 PACF 是

φ11=φ1,φkk=0,k2\varphi _{11} = \varphi _1, \qquad \varphi _{kk} = 0, \forall k \geq 2

平稳 AR(2)\mathrm{AR}(2) 模型的 PACF 是

φ11=φ11φ2,φ22=φ2,φkk=0,k3\varphi _{11} = \frac{\varphi _1}{1 - \varphi _2}, \qquad \varphi _{22} = \varphi _2, \qquad \varphi _{kk} = 0, \forall k \geq 3

  PACF 可以从递推式直观理解. AR(1)\mathrm{AR}(1) 的递推式是

Xt=φ0+φ1Xt1+σε2X_t = \varphi _0 + \varphi _1 X_{t-1} + \sigma _\varepsilon ^2

考虑一阶 PACF, XtX_tXt1X_{t-1} 之间没有序列项, 所以一阶 PACF 直接是 φ1\varphi _1. 考虑二阶 PACF, 在 Xt1X_{t-1} 给定后, XtX_t 也固定, 与 Xt2X_{t-2} 的值无关, 所以二阶 PACF 为零.

  AR(2)\mathrm{AR}(2) 的递推式是

Xt=φ0+φ1Xt1+φ2Xt2+σε2X_t = \varphi _0 + \varphi _1 X_{t-1} + \varphi _2 X_{t-2} + \sigma _\varepsilon ^2

考虑二阶 PACF

φ22=Corr(Xt,Xt2Xt1)=Corr(φ0+φ1Xt1+φ2Xt2,Xt2Xt1)=Corr(φ2Xt2,Xt2Xt1)=φ2\begin{aligned} \varphi _{22} & = \mathrm{Corr}(X_t, X_{t-2} \mid X_{t-1})\\ & = \mathrm{Corr}(\varphi _0 + \varphi _1 X_{t-1} + \varphi _2 X_{t-2}, X_{t-2} \mid X_{t-1})\\ & = \mathrm{Corr}(\varphi _2 X_{t-2}, X_{t-2} \mid X_{t-1}) = \varphi _2 \end{aligned}

考虑一阶 PACF. 在给定 Xt2X_{t-2} 后, 由于 Xt1X_{t-1}Xt2X_{t-2} 仍有联系, 所以 Xt1X_{t-1} 的该部分实际已被固定, 但仍有其自由部分. 一阶 PACF 衡量的是其自由部分与 XtX_t 的相关性.

3.3 MA 模型

3.3.1 MA 模型的定义

  qq 阶 MA 模型具有如下结构:

{Xt=μ+εtθ1εt1θqεtq,θq0εtWN(0,σε2)\left\{ \begin{aligned} & X_t = \mu + \varepsilon _t - \theta _1 \varepsilon _{t-1} - \cdots - \theta _q \varepsilon _{t-q}, \quad \theta _q \neq 0\\ & \varepsilon _t \sim \mathrm{WN}(0, \sigma _\varepsilon ^2) \end{aligned} \right.

MA 模型的中心化 考虑中心化 XtXtμX_t \gets X_t - \mu 就能使 μ=0\mu = 0. 以下分析序列值之间相关关系时, 一般简化为分析中心化模型.

3.3.2 MA 模型的统计性质

均值 均值为常数 EXt=μ\mathrm EX_t = \mu.

方差 方差为常数 DXt=(1+θ12++θq2)σε2=:σ2\mathrm DX_t = (1 + \theta _1^2 + \cdots + \theta _q^2) \sigma _\varepsilon ^2 =: \sigma ^2.

ACVF ACVF 仅与时间间隔有关, 且 qq 阶截尾

γk={(1+θ12++θq2)σε2,k=0(θk+θ1θk+1+θ2θk+2++θqkθq)σε2,k=1,,q0,k=q+1,\gamma _k = \begin{cases} (1 + \theta _1^2 + \cdots + \theta _q^2) \sigma _\varepsilon ^2, \quad & k = 0\\ (-\theta _k + \theta _1\theta _{k+1} + \theta _2\theta _{k+2} + \cdots + \theta _{q-k}\theta _q) \sigma _\varepsilon ^2, \quad & k = 1, \dots, q\\ 0, \quad & k = q+1, \dots \end{cases}

ACF ACF 仅与时间间隔有关, 且 qq 阶截尾

ρk={1,k=0θk+θ1θk+1+θ2θk+2++θqkθq1+θ12++θq2,k=1,,q0,k=q+1,\rho _k = \begin{cases} 1, \quad & k = 0\\ \dfrac{-\theta _k + \theta _1\theta _{k+1} + \theta _2\theta _{k+2} + \cdots + \theta _{q-k}\theta _q}{1 + \theta _1^2 + \cdots + \theta _q^2}, \quad & k = 1, \dots, q\\ 0, \quad & k = q+1, \dots \end{cases}

MA(1)\mathrm{MA}(1) 模型的 ACF 为 ρ1=θ1/(1+θ12)\rho _1 = -\theta _1 / (1 + \theta _1^2), MA(2)\mathrm{MA}(2) 模型的 ACF 为

ρ1=θ1+θ1θ21+θ12+θ22,ρ2=θ21+θ12+θ22\rho _1 = \frac{-\theta _1 + \theta _1 \theta _2}{1 + \theta _1^2 + \theta _2^2}, \qquad \rho _2 = \frac{-\theta _2}{1 + \theta _1^2 + \theta _2^2}

3.3.3 MA 模型的可逆性

  为了保证一组给定的 ACF (ρ1,,ρq)(\rho _1, \dots, \rho _q) 只对应唯一的 MA(q)\mathrm{MA}(q) 模型, 我们约束 MA(q)\mathrm{MA}(q) 必须具备可逆性 (invertibility).

可逆性与逆函数MA(q)\mathrm{MA}(q) 模型可以写成 AR()\mathrm{AR}(\infty) 模型的形式. 即

Xt=εtθ1εt1θqεtqX_t = \varepsilon _t - \theta _1 \varepsilon _{t-1} - \cdots - \theta _q \varepsilon _{t-q}

可以合并成 {Xt}\{X_t\} 的线性组合的形式. 考虑逆函数 I()I_{(\cdot)} 是线性组合的系数

εt=Xt+I1Xt1+I2Xt2++It1X1\varepsilon _t = X_t + I_1 X_{t-1} + I_2 X_{t-2} + \cdots + I_{t-1} X_1

若该 AR 模型是收敛的, 则称原 MA 模型是可逆的. MA 模型的逆函数与 AR 模型的 Gauss 函数有完全相同的递推公式

Ik={1,k=0θ1Ik1++θkI0,k=1,,qθ1Ik1++θqIkq,k=q+1,I_k = \begin{cases} 1, \quad & k = 0\\ \theta _1 I_{k-1} + \cdots + \theta _k I_0, \quad & k = 1, \dots, q\\ \theta _1 I_{k-1} + \cdots + \theta _q I_{k-q}, \quad & k = q+1, \dots\\ \end{cases}

特征根判别MA(q)\mathrm{MA}(q) 模型的特征方程是

λqθ1λq1θq=0\lambda _q - \theta _1 \lambda _{q-1} - \cdots - \theta _q = 0

该模型可逆当且仅当它特征方程的 qq 个特征根都在单位圆内.

平稳域判别MA(1)\mathrm{MA}(1) 的平稳域是 1<θ1<1-1 < \theta _1 < 1; MA(2)\mathrm{MA}(2) 的平稳域是点 {(0,1),(2,1),(2,1)}\{(0, 1), (2, -1), (-2, -1)\} 构成的三角区域.

3.3.4 MA 模型的 PACF

  AR(p)\mathrm{AR}(p) 模型 PACF pp 阶截尾. 因为 MA(q)\mathrm{MA}(q) 模型等价于 AR()\mathrm{AR}(\infty) 模型, 所以 MA 模型 PACF 拖尾. PACF 可用 Yule-Walker 方程组求解.

 计算 MA(1)\mathrm{MA}(1) 模型的 PACF. 计算可得

φ11=ρ1=θ11+θ12,φ22=ρ2ρ121ρ12=θ121+θ12+θ14\varphi _{11} = \rho _1 = \frac{-\theta _1}{1 + \theta _1^2}, \qquad \varphi _{22} = \frac{\rho _2 - \rho _1^2}{1 - \rho _1^2} = \frac{-\theta _1^2}{1 + \theta _1^2 + \theta _1^4}

以此类推可以得到 MA(1)\mathrm{MA}(1) 模型 PACF 的通解

φkk=θ1k1+θ12++θ12k\varphi _{kk} = \frac{-\theta _1^k}{1 + \theta _1^2 + \cdots + \theta _1^{2k}}

3.4 ARMA 模型

3.4.1 ARMA 模型的定义

  ARMA(p,q)\mathrm{ARMA}(p, q) 模型具有如下结构:

{Xt=φ0+φ1Xt1++φpXtp+εtθ1εt1θqεtqφp0,θq0εtWN(0,σε2),Xsεt,s<t\left\{ \begin{aligned} & X_t = \varphi _0 + \varphi _1 X_{t-1} + \cdots + \varphi _p X_{t-p} + \varepsilon _t - \theta _1 \varepsilon _{t-1} - \cdots - \theta _q \varepsilon _{t-q}\\ & \varphi _p \neq 0, \quad \theta _q \neq 0\\ & \varepsilon _t \sim \mathrm{WN}(0, \sigma _\varepsilon ^2), \quad X_s \perp \varepsilon _t, \forall s < t \end{aligned} \right.

3.4.2 ARMA 模型的平稳性与可逆性

平稳条件ARMA(p,q)\mathrm{ARMA}(p, q) 模型的平稳性完全由它的 AR 部分决定. ARMA(p,q)\mathrm{ARMA}(p, q) 模型平稳等价于它 AR 部分特征方程的 pp 个特征根都在单位圆内.

可逆条件ARMA(p,q)\mathrm{ARMA}(p, q) 模型的可逆性完全由它的 MA 部分决定. ARMA(p,q)\mathrm{ARMA}(p, q) 模型可逆等价于它 MA 部分特征方程的 qq 个特征根都在单位圆内.

传递形式ARMA(p,q)\mathrm{ARMA}(p, q) 模型可以写成 MA()\mathrm{MA}(\infty) 模型的形式, 即

Xt=G0εt+G1εt1++Gt1ε1X_t = G_0 \varepsilon _t + G_1 \varepsilon _{t-1} + \cdots + G_{t-1} \varepsilon _1

其中 Green 函数

Gk={1,k=0φ1Gk1++φkG0θk,k=1,,pφ1Gk1++φpGkpθk,k=p+1,G_k = \begin{cases} 1, \quad & k = 0\\ \varphi _1 G_{k-1} + \cdots + \varphi _k G_0 - \theta _k, \quad & k = 1, \dots, p\\ \varphi _1 G_{k-1} + \cdots + \varphi _p G_{k-p} - \theta _k, \quad & k = p+1, \dots\\ \end{cases}

这里定义 k>qk>qθk\theta _k 为零.

 计算 ARMA(1,1)\mathrm{ARMA}(1, 1) 模型的 Green 函数. 它的 Green 函数有递推式

Gk={1,k=0φ1θ1,k=1φ1Gk1,k=2,G_k = \begin{cases} 1, \quad & k = 0\\ \varphi _1 - \theta _1, \quad & k = 1\\ \varphi _1 G_{k-1}, \quad & k = 2, \dots\\ \end{cases}

可以迭代地解出它的 Green 函数

G0=1,Gk=(φ1θ1)φ1k1G_0 = 1, \qquad G_k = (\varphi _1 - \theta _1) \varphi _1^{k-1}

逆转形式ARMA(p,q)\mathrm{ARMA}(p, q) 模型可以写成 AR()\mathrm{AR}(\infty) 模型的形式, 即

εt=Xt+I1Xt1+I2Xt2++It1X1\varepsilon _t = X_t + I_1 X_{t-1} + I_2 X_{t-2} + \cdots + I_{t-1} X_1

其中逆函数

Ik={1,k=0θ1Ik1++θkI0φk,k=1,,qθ1Ik1++θqIkqφk,k=q+1,I_k = \begin{cases} 1, \quad & k = 0\\ \theta _1 I_{k-1} + \cdots + \theta _k I_0 - \varphi _k, \quad & k = 1, \dots, q\\ \theta _1 I_{k-1} + \cdots + \theta _q I_{k-q} - \varphi _k, \quad & k = q+1, \dots\\ \end{cases}

这里定义 k>pk>pφk\varphi _k 为零.

3.4.3 ARMA 模型的统计性质

均值μ=φ0/(1φ1φp)\mu = \varphi _0/(1 - \varphi _1 - \cdots - \varphi _p).

方差σ2=(G02+G12+)σε2\sigma ^2 = (G_0^2 + G_1^2 + \cdots) \sigma _\varepsilon ^2.

 计算 ARMA(1,1)\mathrm{ARMA}(1, 1) 模型的方差.

σ2=(G02+G12+)σε2=(1+(φ1θ1)2(1+φ12+φ14+))σε2=1+θ122φ1θ11φ12σε2\begin{aligned} \sigma ^2 & = (G_0^2 + G_1^2 + \cdots) \sigma _\varepsilon ^2\\ & = (1 + (\varphi _1 - \theta _1)^2 (1 + \varphi _1^2 + \varphi _1^4 + \cdots)) \sigma _\varepsilon ^2\\ & = \frac{1 + \theta _1^2 - 2\varphi _1 \theta _1}{1 - \varphi _1^2} \sigma _\varepsilon ^2 \end{aligned}

ACVFγk=(G0Gk+G1Gk+1+)σε2\gamma _k = (G_0G_k + G_1G_{k+1} + \cdots) \sigma _\varepsilon ^2.

 计算 ARMA(1,1)\mathrm{ARMA}(1, 1) 模型的 ACVF (k1k \geq 1).

γk=(G0Gk+G1Gk+1+)σε2=((φ1θ1)φ1k1+(φ1θ1)2(φ1k+φ1k+2+φ1k+4+))σε2=(φ1θ1)φ1k1(1+(φ1θ1)φ11φ12)σε2=(φ1θ1)(1φ1θ1)1φ12φ1k1σε2\begin{aligned} \gamma _k & = (G_0G_k + G_1G_{k+1} + \cdots) \sigma _\varepsilon ^2\\ & = ((\varphi _1 - \theta _1) \varphi _1^{k-1} + (\varphi _1 - \theta _1)^2 (\varphi _1^k + \varphi _1^{k+2} + \varphi _1^{k+4} + \cdots)) \sigma _\varepsilon ^2\\ & = (\varphi _1 - \theta _1) \varphi _1^{k-1}\left( 1 + \frac{(\varphi _1 - \theta _1)\varphi _1}{1 - \varphi _1^2} \right) \sigma _\varepsilon ^2\\ & = \frac{(\varphi _1 - \theta _1) (1 - \varphi _1 \theta _1)}{1 - \varphi _1^2} \varphi _1^{k-1} \sigma _\varepsilon ^2 \end{aligned}

ACFρk=γk/σ2\rho _k = \gamma _k / \sigma ^2.

 计算 ARMA(1,1)\mathrm{ARMA}(1, 1) 模型的 ACF (k1k \geq 1).

ρk=γkσ2=(φ1θ1)(1φ1θ1)1+θ122φ1θ1φ1k1\rho _k = \frac{\gamma _k}{\sigma ^2} = \frac{(\varphi _1 - \theta _1) (1 - \varphi _1 \theta _1)}{1 + \theta _1^2 - 2\varphi _1 \theta _1} \varphi _1^{k-1}

本系列的参考文献

[1] 王燕. 应用时间序列分析[M]. 第 6 版. 北京:中国人民大学出版社, 2022.

[2] University of South Carolina. Chapter 6: Model Specification for Time Series. https://people.stat.sc.edu/hitchcock/stat520ch6slides.pdf.

附录 A 常系数线性差分方程和递推数列

A.1 常系数线性差分方程

  pp 阶齐次常系数线性差分方程具有结构

xt+a1xt1++apxtp=0x_t + a_1 x_{t-1} + \cdots + a_p x_{t-p} = 0

将其中的 xkx_k 换成 λk\lambda ^k 然后约分即得它的特征方程

λp+a1λp1++ap=0\lambda ^p + a_1 \lambda ^{p-1} + \cdots + a_p = 0

它有 pp 个根, 称为特征根.

解的结构 差分方程的解是 pp 个小项的任意线性组合:

  • λ\lambda 为实单根, 则它贡献 CλtC \lambda ^t 一个小项.
  • λ\lambda 为实 mm-重根, 则它贡献 (C0+C1t++Cm1tm1)λt(C_0 + C_1t + \cdots + C_{m-1}t^{m-1})\lambda ^tmm 个小项.
  • α±βi\alpha \pm \beta \mathrm i 为一对复单根, 则它贡献 eαt(Acosβt+Bsinβt)e^{\alpha t}(A\cos \beta t + B\sin \beta t) 两个小项.
  • α±βi\alpha \pm \beta \mathrm i 为一对复单根, 则它贡献 eαt((A0+A1t++Am1tm1)cosβt+(B0+B1t++Bm1tm1)sinβt)e^{\alpha t}((A_0 + A_1t + \cdots + A_{m-1}t^{m-1})\cos \beta t + (B_0 + B_1t + \cdots + B_{m-1}t^{m-1})\sin \beta t)2m2m 个小项.

差分方程的通解是所有小项的线性组合, 它有 pp 个自由实变量.

A.2 常系数线性递推数列

  一个常系数线性递推式

xt=a1xt1+a2xt2++apxtpx_t = a_1 x_{t-1} + a_2 x_{t-2} + \cdots + a_p x_{t-p}

的特征方程是把 x()x_{(\cdot)} 换成 λ()\lambda ^{(\cdot)} 后约分的结果

λp=a1λp1+a2λp++ap\lambda _p = a_1 \lambda _{p-1} + a_2 \lambda _{p} + \cdots + a_p

它有 pp 个根, 称为特征根. 常系数线性递推数列的解 (通项公式) 的结构与常系数线性差分方程是完全相同的.

 求解 Fibonacci 数列

{Ft=Ft1+Ft2F1=F2=1\left\{ \begin{aligned} F_t & = F_{t-1} + F_{t-2}\\ F_1 & = F_2 = 1 \end{aligned} \right.

的通项公式. 它的特征方程是

x2=x+1x^2 = x + 1

它的解是黄金分割 φ,ψ\varphi, \psi

φ=1+52,ψ=152\varphi = \frac{1 + \sqrt 5}{2}, \qquad \psi = \frac{1 - \sqrt 5}{2}

所以它的通解有形式

Ft=C1φt+C2ψtF_t = C_1 \varphi ^t + C_2 \psi ^t

考虑初值条件 F1=F2=1F_1 = F_2 = 1, 可以解得 C1=1/5C_1 = 1/\sqrt 5C2=1/5C_2 = -1/\sqrt 5.