Page 77 - 201901
P. 77
2019 年第 1 期
权)、렬강(列强)等;指标 17:中国,特征词为중국(中国);指标 18:日本,
包含的特征词有독도(独岛)、과거사(过去史)、교과서(教科书)、위안부/성노
예(慰安妇)等;指标 19:联合国,包含的特征词有유엔(联合国)、국제법(国
际法)等。
第三组变量是朝鲜拥核目标。朝鲜对国际社会的诉求最主要的是政治安全目标。
该组变量包括两个指标,分别是:指标 20:朝鲜自主性国家目标,特征词与指标 6
的特征词相同;指标 21:朝鲜与国际社会的互动交流,包含的特征词有:회담(会
谈)、방문(访问)、방북(访朝)等。
第四组变量与对韩报道特征集的第三组变量相同,是核导武器,包括两个指标,
分别是:指标 22:核导力量;指标 23:无核化。两个指标的特征词分别与指标 11
和指标 12 的特征词相同。
综上,我们一共得到 11 个分析对韩报道的特征指标和 12 个分析对外报道的特
①
征指标。 这 23 个指标在各月的值为各指标在当月朝鲜媒体报道中出现的频率,
即各指标所有特征词在当月朝鲜媒体报道中出现的总次数与当月朝鲜媒体报道文
字的总词数的比值(变量的统计描述情况请参见附表 1 )。
②
(四)指标的独立性检验
运用朴素贝叶斯方法构建预测模型,须满足各特征指标彼此相互独立这一前提
条件。本文对 23 个指标进行相关性分析。分析结果如附表 2 相关矩阵所示,各指
标之间均满足“类条件独立”的要求。
(五)指标的初筛
由于这 23 个指标并不一定都有很好的预测能力,因此还需对其进行初步筛选,
以使随后构建的贝叶斯模型更加精简和准确。考虑到核威胁指数中,无核行为( )
1
和有一定威胁程度核行为( )数据相对较少,同时被解释变量为离散数据,回归精
2
度有限,所以初筛后保留对朝鲜核行为的显著性在 30%及以下水平的指标,剔除其
余指标。此过程中保留相对丰富的指标,也有助于提高贝叶斯预测的准确率。其中,
在 10%及以下水平上显著的指标可视为对朝鲜核行为威胁指数非常有解释力;在
10%~30%水平上显著的指标可视为比较有解释力。
由于朝鲜发布新闻报道发生在前,所预测的朝鲜核行为发生在后,两者之间必
然存在时间上的滞后性,因此这里假设各指标在滞后一期、滞后两期、滞后三期均
① 由于篇幅所限,“各指标及其对应的特征词”读者可向作者索取。
② 本文附表 1~5 可向责任编辑索取。责任编辑电子邮箱:croton 1985@163.com。
· 75 ·