文章插图
(1) 称为观测方程 , 反映观测值与其背后隐藏状态的关系;(2) 称为状态方程 , 反映随时间推移各个状态之间的转换 。;
文章插图
都是不同变量之间的“关系映射矩阵”;
文章插图
是独立于其他变量且服从正态分布的噪声 。所谓数据的“结构化” , 主要包括:
- Linear Local Trend(局部趋势):一定时间内的单调性(单调上升或下降)
- Seasonality(季节性因子):固定长度的变化 , 类似于一年四季的温度变化
- Cyclical(周期性):类似季节性但波动时间不固定 , 波动频率也不固定的变化
文章插图
图3-1:观测数据及其结构化元素 。第一张图体现原数据的波动情况;第二张体现季节性因子的情况;第三张图体现局部趋势的情况 。
如果希望在映射关系中加入协变量X , 可以将(1)拓展为:
文章插图
其中
文章插图
表示协变量X与观测数据之间的关系 , 如果协变量项表现很好(如有显著影响)的话 , 那对应的local trend就会相对较弱 。上述三个方程中的参数将在后文中展示估计方式 。
3.2 贝叶斯及MCMC(马尔可夫蒙特卡洛方法)
假设状态方程(2)中各个时刻的状态序列为
文章插图
表示模型中所有的参数 。我们现在希望对θ进行估计 , 核心步骤如下:
- 对θ设置先验分布
文章插图
以及初始状态的分布
文章插图
- 构造马尔科夫链 , 用MCMC方法得到
文章插图
- 通过贝叶斯公式计算得到参数的后验分布
文章插图
1)贝叶斯估计:BSTS模型的一大特点就是在参数估计上使用了贝叶斯估计 , 即在估计之前先给出参数设置先验分布 , 随后再结合样本数据给出参数的后验分布 。不同类型的参数一般有一些常用的先验分布 , 例如均值一般使用正态分布 ,
文章插图
, 方差使用inverse-Gamma分布 ,
文章插图
协方差矩阵可以使用IW分布等等 。值得注意的是 , 先验分布的设置一定程度上会影响后续MCMC收敛的情况以及后验分布的准确性 , 因此并不能太过随意地设置先验分布 , 应尽可能多地根据实际数据推导出最合适的先验分布 , 或是比较各先验分布下后验分布和似然函数的值来进行选择 。
2)MCMC方法:我们尝试构造一条马尔可夫链(一种特殊的序列 , 当前时刻的状态值仅与前一时刻的状态值有关 , 最终序列会收敛到某个稳定的分布) , 使得其最终收敛的稳态分布就是参数的后验分布 。这一过程我们可以通过Gibbs采样实现:设置先验分布之后 , 从初始状态
文章插图
出发 , 每次固定α采样θ;再固定θ采样α , 逐渐一次次更新两组参数 , 最终形成一条服从马尔可夫性质的链路
文章插图
, 可以证明其稳态收敛的分布就是
推荐阅读
- 小李子狂撩37岁俄罗斯超模,聚会到凌晨离开,女方还曾迷倒C罗侃爷!
- 克里斯·埃文斯倾情演绎,英雄的诞生与正义的战斗,引发观众深思
- 网红rose被吐槽,模仿菲利斯假借孝心赚流量,网友:找茬博眼球
- 提拉米苏和慕斯的区别,哪个好吃 提拉米苏和慕斯的区别
- 小托马斯:科比的敬业NBA第一,他决不会像詹姆斯杜兰特选择抱团
- 粉丝超千万的网红rose被吐槽,处处模仿菲利斯,假借孝心博流量
- 格瓦斯是什么 格瓦斯是什么意思
- 美媒将职业生涯场均23分以上的29人划分成6档,詹姆斯阿杜同一档
- 陈佩斯豪宅被曝光,4个孙子和他长得非常相似
- 五步让你掌握Python数据结构