Page 9 - 《国际安全研究》2020年第1期
P. 9
2020 年第 1 期
为深度学习算法的优化提供了海量、多维度的训练数据,并且图形处理器(GPGPU)
芯片弥补了中央处理器(CPU)在并行计算上的短板,为深度学习的训练提供了大规
模、高速率的算力支撑。与此同时,深度学习能够通过组合低层特征形成更加抽象的
高层属性与类别,并以自主学习数据的分布特点进行特征判别和逻辑推测,进而构建
了以“数据挖掘、自动学习和自主认知”为基本分析路径的机器学习范式。因此,在
“数据、算力与算法”三者的共振下,人工智能就逐渐进化为一种能够进行自我学习、
自我推理以及自我适应的技术,并具备以近乎“人类思维”处理复杂问题的能力。
人工智能的进一步发展还催生了强化学习、迁移学习、生成对抗网络等新型算
①
法,并推动了算法模型、图像识别、自然语言处理等方面出现迭代式的技术突破。
正如图灵奖得主吉姆·格雷(Jim Gray)所言,新的信息技术推动了科学研究的“第四
②
范式”出现——数据密集型科学发现(Data-Intensive Scientific Discovery)。 而基
于数据、算法与算力驱动的人工智能技术是这一范式的典型技术代表。实际上,由
于人工智能的广泛应用将对交通、医疗、教育、法律、金融、传媒等诸多社会领域
产生巨大影响,因此,多数研究将人工智能视为第四次工业革命的引领性技术,也
将这次革命称为“智能革命”。
目前,学界尚未对人工智能研究及应用的领域形成统一的认识,但就当前人工智
能的技术研究和应用代表来说,可以将其分为以下六个子研究领域:一是机器学习
(machine learning),即通过设定模型、输入数据对机器进行训练,让机器生成特定的
③
算法,并利用这一经由归纳、聚合而形成的算法对未知数据进行识别、判断与预测。
① [美] 雷·库兹韦尔:《奇点临近》,盛杨燕译,杭州:浙江人民出版社 2016 年版,第
80-82 页。
② Tony Hey, Stewart Tansley and Kristin Tolle, The Fourth Paradigm: Data-intensive Scientific
Discovery, Redmond, WA: Microsoft Research, 2009, pp.1-2.
③ 机器学习主要分为以下五大类:一是监督学习(supervised learning):以人为标注的数
据集作为训练集,训练目标为从训练集中学习出新函数,以对新的数据进行标注。二是无监督学
习(unsupervised learning):训练集没有人为标注的结果,但训练目标也是对新的数据进行标注。
三是增强学习(reinforcement learning):又被称为强化学习,训练对象在特定的环境进行持续
性的自我训练,并根据周围环境的反馈来做出各种特定行为,以实现最优的映射学习行为与决策。
四是迁移学习(transfer learning):将已经训练好的源任务(source tasks)的知识或模型的参数
迁移到新的目标领域(target domain)。五是半监督学习(semi-supervised learning):是一种介
于监督学习与无监督学习之间的方法,更强调让训练对象不依赖外界交互、自动地利用未标记的
样本来提升学习性能。关于机器学习的具体介绍,可以参见 Christopher Bishop, Pattern Recognition
and Machine Learning, New York: Springer Press, 2007; Kevin Murphy, Machine Learning: A
Probabilistic Perspective, Cambridge, MA: The MIT Press, 2012; 周志华:《机器学习》,北京:清
华大学出版社 2016 年版,第 2-18 页。
· 7 ·