Page 90 - 201901
P. 90
朝鲜核行为预测:变化无常还是有章可循
型。运用该预测模型,可根据前三个月的数据对未来一月朝鲜核行为进行预测。结果
显示,本文建立的朴素贝叶斯预测模型的整体准确率超过 80%,预测效果稳健。本文
的研究显示,朝鲜的对外行为完全有可能通过公开信息实现科学预测。
本文的建模过程提供了一种构建朝鲜对外行为预测模型的一般性思路,这种思
路的核心内容就是利用贝叶斯方法,从已发生的事件中找到使预测结果发生概率最
大化的条件。这种建模思路的基本步骤是:首先,根据现有专业研究成果,梳理对
朝鲜某类行为相关因素的讨论。其次,根据上述梳理,确定有可能与朝鲜该类行为
存在关联的特征指标,并根据可公开获取的朝鲜官方媒体报道,拟定报道文字中能
够反映这些指标的特征词。然后,对这些指标的独立性做出检验,如果各指标满足
相互独立的要求,则采用朴素贝叶斯方法,如果不满足,则采用贝叶斯网络或半朴
素贝叶斯方法。然后,通过回归分析对所有特征指标进行初筛,剔除对预测结果关
联不显著的特征指标。最后,利用筛选后得到的显著指标和各类行为的先验概率,
计算得出贝叶斯预测模型。通过预测模型来测定未来一个月朝鲜的核威胁程度。此
外,为有效解决朝鲜媒体报道数据搜集的滞后性问题,本文还在已有数据基础上对
全部 23 个指标进行 SARIMA 时间序列分析,模拟未来 6 个月的指标数据。补全后
的序列不仅通过邹突变点检验,而且模拟出的数据预测准确率为 100%。这证明,
SARIMA 时间序列方法模拟数据具备可信性和高准确度。
从整体检验结果看,本文的模型预测仍然存在一定的误差。一个可能的原因是
某些有可能影响朝鲜核行为的因素未纳入考察范围,比如前文提及的朝鲜核技术本
身的发展水平。另一个可能的原因是数据中固有的噪声问题。由于政治学中尚没有
有效地平滑数据的方法, 这也会在一定程度上影响了模型的准确度。为了克服这
①
些因素的负面影响,进一步提高预测的准确率,应该加强对朝鲜核行为的理论研究,
力求更全面地掌握与朝鲜核行为存在关联的所有因素,进一步丰富特征集;同时将
贝叶斯预测方法与大数据技术紧密结合,扩大数据来源和样本量,以弥补噪声导致
的误差。笔者相信,随着计算社会科学方法和技术的不断提高,我们对朝鲜乃至任
何国家对外政策的研究都将更加前瞻化和科学化。
【来稿日期:2018-09-08】
【修回日期:2018-12-02】
【责任编辑:谢 磊】
① 初始文本、文本统计过程中存在难以避免的误差,比如朝鲜故意通过新闻媒体释放烟雾
弹,等等。
· 88 ·