O21-5-2.《贝叶斯统计》笔记(第二部分:Bayes 决策)
4 决策中的收益、损失与效用
4.1 决策问题的三要素
决策问题有三个基本要素:
-
状态集 Θ={θ}, 每个元素表示自然界(或社会)可能出现的一种状态. 状态集可以是离散的也可以是连续的.
-
行动集 A={a}, 每个元素表示人对自然界(或社会)可能采取的一个行动.
-
收益函数 Q:Θ×A→R, 表示自然界(或社会)处于状态 θ 而人们选取行动 a 时所得到(经济上)的收益大小.
当 Θ={θ1,…,θn} 和 A={a1,…,an} 元素数量都有限时, 收益函数可以排成一个矩阵
Q=(Qij)n×m=(Q(θi,aj))n×m
4.2 决策准则
4.2.1 行动的容许性
行动的容许性 如果一个行动 a∗ 总比另一个行动 a0 收益高, 即
∀θ∈Θ,Q(θ,a∗)≥Q(θ,a0),∃θ0∈Θ,Q(θ0,a∗)>Q(θ0,a0)
则称 a0 是非容许的.
行动的等价性 如果两个行动 a1,a2 收益总相等, 即
∀θ∈Θ,Q(θ,a1)=Q(θ,a2)
则称 a1,a2 是等价的.
4.2.2 决策准则
悲观(差中求好)准则 先计算每一个行动 a 的最坏条件收益, 然后选取最大值. 即
a∗=a∈Aargmaxθ∈ΘminQ(θ,a)
它能保证最坏条件下的收益下限.
乐观(好中求好)准则 先计算每一个行动 a 的最好条件收益, 然后选取最大值. 即
a∗=a∈Aargmaxθ∈ΘmaxQ(θ,a)
它在设想最有利条件下, 尽量争取最多的收益.
Hurwisz 折中准则 以一个乐观系数 α∈[0,1] 平衡乐观准则与悲观准则. 即
a∗=a∈Aargmax(αθ∈ΘmaxQ(θ,a)+(1−α)θ∈ΘminQ(θ,a))
4.3 先验期望准则
先验收益 若状态集 Θ 是一个随机变量, 有一个先验分布 π(θ), 则先验收益 Q(θ,a) 也是一个随机变量. 可以定义先验收益的期望和方差
EQ∣θ,DQ∣θ=EQ2∣θ−(EQ∣θ)2
它们都是关于 a 的函数, 即 (EQ∣θ)(a) 和 (DQ∣θ)(a).
先验期望准则 使先验收益期望达到最大的行动称为先验期望准则下的最优行动, 即
a∗=aargmaxEQ∣θ
如果有多个最优行动, 则先验方差最小的行动称为二阶矩准则下的最优行动. 先验期望准则有如下性质:
-
收益函数 Q(θ,a) 的单调递增线性变换 Q′(θ,a)=a+bQ(θ,a),a>0 不改变最优行动.
-
某些状态 Θ1 下所有行动的收益同时增加常数 c, 不改变最优行动.
4.4 损失函数