Page 78 - 201901
P. 78
朝鲜核行为预测:变化无常还是有章可循
有可能对朝鲜核行为产生影响。由于本文是用当月已知的新闻信息预测朝鲜下一个
月的核行为,因此滞后一期的含义是前一月[即(t-1)月]的特征指标对该月(月)
的核行为有提示预警作用;滞后两期、滞后三期同理。将各指标的滞后一期、两期
和三期都作为解释变量纳入 Probit 回归模型,被解释变量为核威胁指数。2006 年 1
月至 2017 年 9 月数据的回归分析结果如附表 3 所示。剔除不显著的指标后,待纳
入朴素贝叶斯分类模型的指标如表 1 所示。
表 1 纳入朴素贝叶斯分类模型的特征指标
特征指标
( − 1)期 指标 1、4、6、8、9、10、11、16、17、18、19、20、21、22
( − 2)期 指标 2、5、6、7、8、9、11、13、15、17、19、23
( − 3)期 指标 1、2、4、9、10、16、17、19、20、21、22、23
三 建模与预测
本部分将根据朴素贝叶斯分类法构建朝鲜核行为的预测模型。首先将 Probit 回
归结果中具有显著性的特征指标纳入模型,计算出朴素贝叶斯估计结果。然后根据
朴素贝叶斯估计结果和 Probit 回归结果,构建朝鲜核行为的预警指标体系,并分析
统计结果的实际意义。最后用朴素贝叶斯模型对历史上的朝鲜核行为进行预测,检
验模型的预测效果,并对模型进行稳健性检验。
(一)朴素贝叶斯预测模型
运用朴素贝叶斯分类方法,设朝鲜核行为预测模型如下:
(( , , ⋯ )| )( )
2
1
� �( , , ⋯ )� = ( = 1,2,3)
1
2
�( , , ⋯ )�
1
2
等式左侧是待计算的后验概率,即在( − 3)月、( − 2)月、( − 1)月中朝鲜媒
体国际新闻中出现某一指标组合时,月朝鲜实施特定威胁程度核行为的概率。其
中, 是类别集合,共有三个取值: 是无核行为,核威胁指数为 0; 是有一定
1
2
威胁程度的核行为,核威胁指数范围为 1~14; 是高威胁程度核行为,核威胁指
3
数范围为≥15。其中最大概率值对应的类别就是朝鲜在月的核行为类别。 , ,
2
1
⋯ 是各 指标 的取值 组合 ,取值 为连 续值属 性。 在 等式 右侧 的分子 中,
(( , , ⋯ )| )是朝鲜采取类别为 (m=1, 2, 3)的核行为时出现上述指标
2
1
组合的概率。( )是朝鲜采取类别为 (m=1, 2, 3)的核行为的先验概率。等式
· 76 ·