Page 75 - 201901
P. 75

2019 年第 1 期

               长时间段的信息。本文选择以这些朝鲜媒体每个月的报道作为一个数据样本,将
               2006 年 1 月至 2017 年 2 月的数据作为训练数据,用朴素贝叶斯方法预测 2017 年
               3 月至 2018 年 3 月的核威胁指数。

                   朝鲜每月的国际新闻报道包括两部分:一是针对韩国的报道,二是针对除韩国
               以外的其他国家的报道。因此,每月数据包括了对韩数据和对外数据两部分。这种
               两分法不是韩国统一部特意做出的,而是直接沿用了朝鲜媒体的做法。例如,

               朝中社就将其国际报道明确划分为朝鲜关系(북남관계)和对外关系(대외관계)
               两类。   这种两分法也印证了前述雅克·海曼斯有关朝鲜将韩国视为一体、与半岛
                     ①
               外国家相对抗的判断。由此看来,韩国与其他国家对朝鲜核行为的影响机制可能存
               在差别,朝鲜媒体对韩报道和对外报道中能够预测朝鲜核行为的特征指标也可能不

               同。因此接下来有必要分别针对数据集中的对韩数据和对外数据,构建两组特征集。
                   (三)特征集
                   构建特征集主要根据可能对结果产生影响的因素,确定典型的代表性指标,并

               剔除不相关的冗余指标。依据第一部分对朝鲜核行为相关因素的梳理,以下构建两
               组特征集,分别用于对对韩报道和对外报道数据的分析。
                                                                   ②
                   1.  对韩报道的特征集
                   根据第二部分的梳理,对韩报道的特征集可划分为三组变量。第一组变量是朝

               韩间的竞争关系。由上文可知,在影响朝鲜核进程的因素中,多数学者认为朝韩之
               间的竞争关系会影响朝鲜拥核的进程。这组变量包括五个指标:指标 1:韩国对

               朝鲜的刺激,相关特征词包括:훈련/연습(演习)、주한미군(驻韩美军)、항공모
               함/항모(航母)、제재(制裁)、인권(人权)等;指标 2:朝鲜对刺激的负面认
               知,包含的特征词有:도전(挑战)、도발(挑衅)、위협(威胁)、공갈(恐吓)、
               고립(孤立)等;指标 3:朝鲜对刺激的强硬性应对,包含的特征词有:초강경(超
               强硬)、저지(抵制)、섬멸(歼灭)、대가(代价)、보복(报复)等;指标 4:朝鲜

               对刺激的外交应对,包含的特征词有비난(批评)、규탄(谴责)、배격(反对)等。


                  ①  朝中社网址:www.kcna.kp。
                  ②  需要指出的是,现有关于朝鲜核行为因素的研究没有包括朝鲜核技术发展水平这个纯技
               术性因素,朝鲜媒体的报道文本也没有包括与该因素有关的内容。笔者意识到并完全承认核技术
               发展水平对朝鲜核行为的影响,但由于缺乏系统性数据,因此所建模型未能包含与该因素有关的
               指标。不过,本文的首要目的是验证朝鲜核行为的可预测性,排除技术性因素的建模无疑是对朝
               鲜核行为可预测性的一个“苛刻”的检验。如果未包含技术性因素的模型已经有较高的预测准确
               度,那么如果包含了技术性因素,准确性无疑会更高。

                                                                                     · 73 ·
   70   71   72   73   74   75   76   77   78   79   80