技术地平线与智能化战争:来自DARPA的报告

无人机 2019-03-04 17:00

2012年2月15日,时任俄罗斯总理梅德韦杰夫表示,俄罗斯政府将就建立高级军事研究局向议会提交一份建议书。新的政府机构将类似于美国的高级研究计划局(DARPA)。作为美国国防科技创新的摇篮,其职责一般都是从事那些有潜在军事用途而又未被陆、海、空军列入现时议程的基础研究。尽管不常显山露水,但无论是武装到牙齿的美军,还是日常生活中的各种新科技,从军事领域到民用领域,DARPA都一直扮演着一个极为重要的角色,是一面我们推进国防科技创新的难得的镜子。


一、冷战中诞生的创新孵化器


1957年10月4日,苏联发射人类第一颗人造卫星“Sputnik-1”。卫星直径58厘米,重83.6公斤(约184磅)。由于当时冷战的特殊背景,美苏两国都密切关注彼此“重要敌人”军备动向,而“Sputnik-1”的成功发射无疑给美国带来了巨大的震撼。第二天,美国《纽约时报》即以醒目的0.5英寸大写字母横贯首页刊印:“时速18000英里环绕地球 无线电信号确认 卫星通过合众国上空轨道”。英国《曼彻斯特卫报》也报道,“‘Sputnik-1’人造卫星已明白无误地显示,莫斯科现在可以制造能够攻击世界任何既定目标的洲际弹道导弹了,显然,俄国人在外空领域已经取得了极大的领先地位,美国的核力量优势从此将成为历史,这是令自由世界倍感痛苦但又不得不接受的残酷事实。”

同日,苏联在其官方报纸《真理报》上也宣布了“Sputnik-1”号人造卫星发射成功的消息:“苏联科学技术获得的新的杰出胜利的消息昨天轰动了全世界。作为我国各科学研究所和设计院极其紧张工作的回报,我们创造了世界上第一颗人造地球卫星。现在这颗卫星以每秒约八千公尺速度绕着地球作椭圆形运转,绕行一周为时一小时三十六点二分钟……”对于这颗人造卫星对美国的含义,苏联的《真理报》也不忘借机嘲讽一番:“现在难道不是美国统治集团走出自己钻进去的死胡同的时候吗?要知道,是他们发起了军备竞赛,宣称他们垄断了原子武器。但是他们的算盘落空了。他们继续军备竞赛,高叫美国独占的氢弹,他们的算盘再次打乱了。他们拒绝苏联的裁军建议,吹嘘自己的火箭武器。这次他们又遭到了失败,因为苏联已经制成了洲际弹道火箭。”

为避免再次出现此类对美国造成被动局面的技术突袭,同时确保其自身的技术优势,1958年2月,美国政府宣布成立高级研究计划局(Advanced Research Projects Agency,简称ARPA),即今天美国国防部高级研究计划局(DARPA)的前身。作为美国国防部的直属机构,DARPA始终坚持其“保持美国技术领先地位,防止潜在对手意想不到的超越”宗旨,在推动创新具有颠覆性影响的新技术和新能力方面做了大量探索性工作,包括互联网、GPS、隐形战机、无人机、高超声速飞机、智能语音助手等在内的诸多领域,都取得了重要突破性科技创新,为美国保持军事技术领先地位奠定了坚实基础,并成为全球创新机构眼中开展前沿性、探索性及颠覆性研究的标杆。

近年来,DARPA持续资助人工智能领域的相关研究。由于防务战略研究的特殊性,尽管只有一定的借鉴性价值,不能照搬照抄或简单对表,但从其公开发布的技术报告中,我依然可以窥见到其有关人工智能技术的探索动向,以及基于战略前沿科技探索的智能化战争理解。


二、面向智能化战争的科技创新


美国军事硬实力和战略威慑力,在很大程度上依赖于其源源不断的科技创新能力,尤其是对战略前沿技术的敏锐捕抓。近几年,DARPA加大了对智能科技的关注与升级,布局的一系列科研探索项目,将标靶瞄向了未来智能化重构的战场。

(一)智能科技的升级

1.透明计算技术——“透明计算”

当计算达到极致所得出的结果仍然只是接近目标而非绝对正确时,计算的智能化就是如何在追求无限近似目标条件下“揭开黑箱”,从而设计出最优方案的过程。然而,由于人们对于计算机系统内部运行的认知就如同黑箱,几乎无从看到具体运行过程。这就极大地限制了人们充分理解网络操作的能力,自然也就无法检测并应对某些重大网络威胁,尤其是某些机理更复杂、时间更持续的网络威胁。

DARPA的“透明计算”项目旨在保证系统性能损耗最低的前提下,通过提供高保真度的可见性,使目前不透明的计算机系统变得更加透明。透明计算主要支持科学研究和实验所涉及的相关计算模型及体系研究,以及推理计算和通信。该项目将开发用于记录并保存所有系统的要素/组件(输入、软件模块及进程等)来源的技术,以动态跟踪交互和网络系统组件间的因果关系,在端对端系统操作中整合与分析这些关系。与此同时,“透明计算”还将开发多层数据收集体系和分析/执行驱动器构成的基本技术和实验原型,以实现主动执行的理想化策略(允许/禁止交互)、近距离实时入侵检测及论证分析,并为计算技术的升级带来新的起点。

2.终极搜索系统——“Memex深网搜索”

有人曾对美国的谷歌做过一个实验,在谷歌搜索栏中输入“the 10 deepest lakes in the U.S”(美国最深的10个湖),而搜索引擎将优先展示基于这些单词或者词组权重最高的句子和网站。针对该实验,谷歌的解释是,搜索引擎还不能明白输入的这句话是一个问题。此外,搜索算法有时还会漏掉不能被标准搜索引擎检索的网络信息,造成跨页共享内容的丢失。由此可见,即便是表现非常出色的网络搜索引擎,也依然存在着亟待解决的技术难题。

DARPA的“Memex深网搜索”项目旨在创造更好的信息交互及分享方法,从而使用户能够快速、全面地组织并搜索与个人兴趣有关的信息子集。深网搜索是一种补充人类记忆的模拟计算技术,它可通过存储和自动交叉引用用户的所有书籍、记录和其他信息以达到快速、灵活地搜索大量信息,进而高效地获得相关见解的功能。该项目将开发远超当前水平,并提供完善内容探索、信息提取、信息检索、用户协作及其他关键搜索功能的先进在线搜索功能机制。

3.精准信息平台——“面向任务的弹性云”

尽管美国有关“云战略”——在未来战争中将信息技术从传统工作站转移至云计算环境的规划早已提出,但如何将敏感数据和计算压缩至云计算系统时的安全性问题仍未完全得以解决。这其中的关键问题就在于,传统安全解决方案中的国家周边防御重点无法覆盖现在的“孤岛”安全。而在云环境中,它将会被进一步边缘化,从而在高速网络环境中构成高度集中的同类主机,且在有限周边防御地区的主机内无需内部检查,而拥有绝对的可信度。

DARPA的“面向任务的弹性云”项目旨在通过开发云计算中的攻击检测、诊断和相应技术,解决某些潜在的安全挑战。为此,该项目将着重研究完成分配的云防御,创建共享态势感知和动态信任模型,将可管理和可分配至任务的多样性引入其他同类云系统中,开发任务感知适应网络技术。同时,该项目还将与美国国防部的“弹性、自适应、安全主机的全新设计”计划同时进行,以限制主机的安全漏洞。

(二)学习能力的提高

华盛顿大学计算机科学教授普德罗·多明戈斯曾指出:“如果机器人掌握了人类除学习以外的所有能力,人类很快就会抛弃它。”但正是由于人工智能的自主学习功能,即人们无需事先以概念的形式告诉它应该怎样做,它就能随着事情的进展而获得“规则”,并逐渐形成能够改善其表现的策略。在这里,人脑与神经网络的不同在于,人脑中的学习能力增强是一个生物化学过程,而神经网络中的学习能力增强另外一种发生机制,即通过修改其自身代码,以在复杂情况下找到输入和输出之间或原因和结果之间的联系。

1.理论框架构建——“学习的根本局限性”

据国际数据公司估测,目前网上在线数据量约为4.4泽字节,而如果能将这些数据输入ipad Air(苹果超薄平板电脑)中,那么产生的堆栈将能够覆盖地球到月球距离的2/3。然而,如何找出数据海洋背后的关联性,则成为机器自主学习的关键。例如,机器学习缺乏对相关领域、问题或数据库相关技术的权衡和数学限制的理解。而这种缺陷正是了解数据、任务、资源和绩效度量之间关系的基本理论框架,这些要素可以帮助我们理解人工智能与任务之间的匹配关系。

DARPA的“学习的根本局限性”项目旨在开发学习系统设计方案能力评估方法及应用规则。该项目将研究能够提供可量化及可归纳性学习测定结果的数学框架,进而设计出具备好性能的系统。此外,该项目还将有助于描述现有的和新型机器学习规范做法之间的基本限度特征,并阐明多种应用中可信度的评价方法。

2.复杂系统建模——“深度有目的学习”

Facebook(脸谱网)曾创建了一种称之为“DeepFace”的脸部识别技术,该技术可凭借深度学习能力,对比两张照片并查看其显示的是否同一人。而在此后不久,Facebook又在“DeepFace”的基础上开发了另一种技术,该技术能够为盲人用户描述图像。例如,一张图片上显示的是某人在一个夏日骑自行车穿过英国乡间小路,该技术在识别后便能用语音将这一情景描述出来。当然,在军事领域,人工智能的深度学习系统要比这里的“面部识别”和“场景描述”复杂得多,其复杂系统建模也成为深度学习中不可缺少的一环。

DARPA的“深度有目的学习”项目旨在利用高效的信息分析和处理方法,推进复杂动态系统建模,并在多个尺度上实现数据和已知物理学的最佳应用。该项目将使用高通量多模态科学数据开发如下内容:降噪和内插随机时间序列数据的新方法;用于预测系统轨迹、弹性和稳定性的产生式模型;调整这种系统最终态势轨迹的新方法。

3.战场对策制定——“自适应电子战行为学习”

智能化战争究竟能否实现?为何我们对此深信不疑,原因或许有两点:一是人工智能技术的需求牵引;二是人工智能的自我进化。对于前者,我们正在经历,而对于后者,也并非天马行空般地猜测。如美陆军发布的《2015-2040机器人和自主系统战略》就制定了增强自主系统态势感知能力在内的一系列计划。

DARPA的“自适应电子战行为学习”项目旨在通过开发新的机器学习算法和技术,将能够快速检测和鉴定新的无线电威胁、动态合成新的对策,并能基于对威胁的无线观测改变提供精确的战损评价,这对于战场环境变化过程中对策的制定将发挥重要作用。

(三)失控风险的控制

对于人类而言,我们习惯于将“人造物”的“失控”归结为事故或者是故障。如飞机失事及列车相撞等。而通常我们在排除这类故障时,会从飞机或火车的制造环节中寻找线索。但人工智能却会改变我们这一观念,其根源就在于人工智能是一种自主系统,其指导下的行为源于一种判断和概率,而并不能给出完全确定的结果,这也就在不经意间给依赖人工智能的系统带来失控的风险。

1.恶意行为问责——“增强身份归属”

有人也许会产生这样的疑问,既然在现阶段人工智能还不太能理解价值追求,不能完成多元价值取舍,而只能按照设定的目标“自我发挥”。那么当设定的目标与价值追求不符时,人工智能是否会为完成目标而做出“极度偏执”的事情呢?答案是肯定的。早在2005年,在美国的一次自动驾驶试验中,一辆大众途锐以每小时32-40公里的速度匀速跑在一条沙漠公路上,车里坐着4位头戴防撞头盔的乘客。车里的计算机通过5个传感器感知外部环境,并控制方向盘。而当这辆汽车驶进一个洼地时,由于汽车向上倾斜,它的激光雷达扫描到了位于车辆上方的树枝,但自动驾驶系统并不清楚这是什么,因此出现了异常,车辆“偏执”地跌出道路而陷到荆棘之中。

DARPA的“增强身份归属”项目就旨在通过使恶意行为具有高保真度的可视性,对目前不透明的恶意行为进行透明化。该项目将开发相关技术和工具,以控制人工智能系统可能出现的“极度偏执”行为。

2.数据污染控制——“可解释人工智能”

微软曾经推出了一款名为“Tay”的聊天机器人,但这款产品在上线不到一周就被迫下线了。原因就在于这款产品表达出一些与主流价值观不吻合的偏激观点。对此,美国人接受不了,而为了避免事态恶化,“Tay”很快被下线了。事后,微软主管研发副总裁彼得·李解回应道:“我们对‘Tay’无意的攻击性以及伤人的话语深表歉意,‘Tay’的言行不代表我们就是这个样子,也不代表我们支持它所说的那些观点,并且有意把它设计成了那个样子。”实际上,“Tay”下线事件所反映的是数据污染的问题。在“数据—学习类算法—行为”的链条之下,数据本身显然会对最终的行为产生关键影响。然而,由于数据量极其庞大,许多时候我们无法控制什么数据会被输入给学习类算法,因此也就无法知道人工智能的准确行为。

DARPA的“可解释人工智能”项目旨在创建具有解释基本原理、描述优势和劣势以及表达对未来表现认识能力的新型机器学习系统。该项目将与最先进的人机交互技术结合,以便将模型转换到最终用户可理解、实用的解释对话中,从而生成一套更新的方法,以解决人工智能系统可能出现的数据污染问题。

3.系统安全运转——“洞察力”

如果我们让每种人工智能系统都处在一个无形的沙盒中,另一面则系统地检测这样一种人工智能系统所产出的各种数据和记录。一旦发现异常,就对其进行调整或关闭。在这里,我们可以认为沙盒是人为设置的人工智能边界,我们通过沙盒控制人工智能的发展。然而,或许人类在使用人工智能的那一天就已经决定了对特定机器或程序失去严密控制的能力。这就好比在AlphaGo与李世石的“人机大战”中,我们无法控制它每遇到一种情形是出好棋还是差棋。事实上,人工智能系统的安全运转需要的是一种社会化的权责控制系统。

DARPA的“洞察力”项目旨在开发通过接收、索引及存储源于多种渠道的数据,并对这些数据进行分析,同时向分析师和数据提供商请求并共享相关信息。该项目采用开放标准化的即插即用架构,可以快速集成现有的和正在开发中的情报、监视和侦查(ISR)技术和来源,并及时做出决策的直观多用户界面,以强化情报分析师对战场实时感知作战的支持,从而有利于人工智能系统的安全运转。


三、DARPA创新机制的独特之处


1958年,ARPA探索大型运载火箭“朱诺Ⅴ”的发展,后移交新成立的美国航空航天局(NASA);1959年,ARPA启动用于探测核爆炸的“船帆座”项目;1960年,ARPA与美国中央情报局联合资助的“日冕”侦察卫星项目成功返回了首批照片;1965年,ARPA资助威廉姆公司开发了WR19小型涡扇发动机,该发动机的改进型后来成为了AGM-86空射导弹和BGM-109“战斧”巡航导弹的动力装置;1969年,由ARPA资助的全球第一个网络“ARPA网”问世;1971年,ARPA启动了用于侦察的“小型遥控无人机”项目;1975年,DARPA启动了有人驾驶隐形飞机的研究;1977年,DARPA资助的验证机“海弗蓝”首飞成功,后发展成为F-117隐形战斗机;1982至1984年,DARPA开展了一个名为“铜溪谷”的秘密项目,后演进为“X-30”空天飞机项目;1997年,DARPA启动了微型无人机(MAV)项目;2001年,DARPA启动了“先进短距起飞和垂直着陆”项目;2007年,DARPA开启了为期三年的“射频应用宽禁带半导体”(WBGS-RF)计划;2008年,DARPA提出了融飞机的速度与航程、水面舰艇的游弋能力及潜艇的隐身能力于一体的“潜水飞机”概念。从2008到2018,近十年来DARPA更是抓紧布局了人工智能、大数据、云计算及高超声速飞行器技术、量子计算等战略战略前沿技术研发。

长期以来,正是在上述这些国防科技创新成绩单辉映下,人们对有关DARPA在促进军用或民用科技创新方面的计划,倍感好奇。与此同时,由于DARPA隶属于美国国防部的原因,这一机构又经常笼罩着一层神秘的面纱。

应该说,在现代国防科技发展史上,美国国防部DARPA机制的诞生,是一个成功的决策范例。在DARPA诞生后的六十年时间里,它取得了举世瞩目的成就。由DARPA开发的军事技术,不仅帮助美国无可争议地占据了全球军事科技研发“执牛耳”的地位,而且,近年来由于美国在其发动的第一次海湾战争、科索沃战争、第二次海湾战争中对这些高科技武器装备的展示,更激发了全球范围内军事技术革命浪潮。对DARPA的研究,不论从理论层面还是现实层面来说,都是一个透视美国国防科技决策机制的窗口。

对于DARPA来说,创意就是一切。在这个聚集着最顶尖人才的机构,正如曾任DARPA局长的托尼.特瑟所言:“我们可以雇佣成千上万的人来执行想法,但是最重要的是先有想法。”潜能的最大发挥来源于机制的有效运行。总结起来,DARPA的模式有如下一些特点:

其一,前瞻性。迈克尔·图什曼和查理斯·奥赖利曾提出,成功的创新领导者会创造出“双性”组织——也就是说,这种组织能够“高效地将今天的工作处理妥当,还能预见明天的非连续性”。拥有这种管理者的组织不仅在当前有能力胜出,甚至在它们应付未来的时候也能技高一筹。

DARPA着眼于未来需求,强调出创意、出概念、出奇招,而不是出对于现实问题的解决方案,“思想的闪光”是DARPA研究项目的起点,其主要责任是感知军方的未来潜在需求,而不是去验证军方提出的现实需求。因此,它对某些新技术的研究往往比其实际应用提前数十年。例如,DARPA从1969年开始进行ARPAnet的研究,而ARPAnet后来逐步发展成为了现在的国际互联网;从1973年开始,DARPA开始进行无人机方面的研究,时至今日,无人机已经成为美军装备体系中不可或缺的关键角色。

从本质上讲,这种前瞻性的研究使用传统的科学研究方法,研究为实现某种未来产品可能的技术方案,其应用前景是强烈的。但是,它的收益既可用遥不可及来形容,又可用遥遥可期来概述,因此,它成功的背后必然得有许多专业人才的前赴后继的持续努力。

其二,独立性。科研机构的某种独立运转,能够激发其新思想的产生,并有利于与外界建立更加广泛的联系。虽然DARPA归属于国防部,但却独立于各军种,与美国海、陆、空军种都是客户关系,具有很强的独立性。它招聘富有远见的技术人员、顶级科学家和工程师,组成一系列小型科研机构,为那些旨在攻克具体技术难关的大学、公共部门和科技企业搭建起科学共同体,并在研究经费使用方面赋予他们非常高的自主支配权,支持有可能实现的想法。一位项目官员要决定是否资助某个项目,通常只需要说服两个人:所在技术办公室的主管和DARPA局长。

独立性使DARPA摆脱了行政指派的传统方式,这就能够充分发挥它的预见性,并激发科学家的探索精神,促进他们之间的交流和合作,从而在一些重大的、前瞻的科技领域取得突破性进展。

其三,敏锐性。DARPA的运营,看上去似乎捉摸不定:资金支持决策不需经专家评审,项目管理人员凭个人意念即可自主决断,唯一遵从的原则就是DARPA始终不渝的使命——支持富于想象和创造性、高风险且符合美国防务利益的研究。

对于DARPA来说,相较于公平性,它更关注的是敏锐性(agile)。它招聘的很多项目主管需要具备很高的素质,他们必须拥有项目投资的丰富经验,对于科研项目的长期应用远景有很敏锐的嗅觉,他们到处寻找潜在的好项目和好人才。DARPA鼓励其工作人员削减没有取得进展的团体的经费,并将资源重新分配给更有希望实现技术突破的团体;而且,出于提高决策效率等方面的考虑,其项目资助过程可以不采用同行评议方式。

美国卡内基梅隆大学(Carnegie Mellon University)工程与公共政策系助理教授Erica R.H.Fuchs在《成功地克隆DARPA模式》中指出,DARPA模式最主要成功因素是其独特的项目官制度。在科研工作中,科研工作者的素质决定了计划实施的进度和水平,而敏锐性又实实在在地构成了落实与执行科研计划的基础。

其四,效益性和效率性。效益性和效率性是每一个科研机构都必须纳入考量的维度。研制的产品能否推进相关领域技术的发展?它的研究能否在尽可能低的成本下发挥最大优势?在这个方面,DARPA似乎有其独到之处。

DARPA将资金提供给大学的研究人员、刚刚起步和在业内稳步立足的公司,以及工业集团等机构,由于其在诸多项目上获得的技术成果只有向军种和工业部门转移才能最终形成产品,进而形成美军的作战能力,可见它的最终目标是为了推动应用技术的进展,任务便自然地延伸到帮助企业把其产品商业化阶段,因此该机构提供给公司的资助远远超过资助经费。

同时,DARPA通过科学计量学指标的数据挖掘分析,若发现有两位科学家同时在攻克同一问题,但采取的技术路线不同,就会对他们分别给予资助,从而防止两人今后潜在的重复研究,而两人也省去了繁复的经费申请过程,双方各得其所。若最后两人中只有一人拿到了DARPA的资助,双方都必须在DARPA组织的研讨会上与大家分享研究思路与工作进展。通过这种方式,DARPA培育出一个研究者社区,推动了社区成员间的协调合作,提高了整体的科研效率。

其五,风险宽容性。发展与风险往往难解难分,因而,对两者的取舍常常让人为难。埃丝特.戴森(Esther Dyson)曾告诫《哈佛商业评论》的读者:“你必须乐于面对风险,乐于进行试验,辩证地看待失败之处。我的信条是:‘即便犯错误也必须是新错误。’犯错误没什么羞耻。只要从中吸取教训不再犯同样的错误就好。我学到的东西,都是我从错误中获得的。”

在创新领域,决策者必须认识到风险与回报之间的密切关系。对于DARPA来说,它强调所进行的是“高风险、高回报”研究,因此它容忍失败,实行开放式学习,形成了一种风险承担的文化。它强调管理风险,而不是逃避风险。因此,它在组织、管理和人事政策方面鼓励个人责任和首创精神,并在项目界定上具有高度的灵活性。DARPA高层的一个重要决策就是筛选出那些勇于承担风险、创新思想驱动的项目主管。

但是,“高风险”并不等价于“高代价”。DARPA允许项目失败,但其严格的项目评审机制在一定程度上又降低了高昂的代价。这种模式与赌牌的一种技巧十分相似。一个精明的牌手知道如果他纠缠着一手死局的牌,就别指望最终能赢,于是他停住下注,放弃该局,等着重新发牌。如果牌势很号,他将继续下去,提高赌注。每当他摸到新牌,他总会判断是否值得继续这一局。而他的原则是一旦发现牌局必输无疑,就尽可能最快、最低代价地从中脱身。同理,DARPA在一个项目或试验刚刚显示出“行不通”时就终止它,这种迅速“收手”的做法在一定程度上能够降低其失败的代价。

其六、广泛联系性。一个顿悟的火花是渺小的,但是,通过与外界的广泛联系,就可以由小聚大,最终产生突破性的创新。莫尔斯想到了点和虚线的创意,并将它们用于传送四位数字码,但是,只有在和韦尔合作的过程中,他才想到了根据点和线的区别来传送字母。

为提高决策水平,推动技术创新和转化,DARPA与外界有着广泛的联系,定期与国防部的文职官员和领导人会面,了解需要研究的问题;定期对军事基地、司令部、训练中心和其他军事机构进行参访、调研,收集情况;广泛征求高级军事领导人的意见,了解他们最关心且难以解决的问题:研究最新的军事行动战例,找出限制美军能力的薄弱环节和问题;与军内外涉及国家安全的诸多部门共同研讨相关专业领域的技术发展问题,探索以创新性方法解决所面临挑战的可行性。

转自丨STM研究中心(xindutianxia)

作者丨石海明 曾华锋,国防科技大学

往期热文(点击文章标题即可直接阅读)


无人机 传播智能机器人时代的航空文化,从无人机的角度关注我们的天空
评论
热门推荐
相关推荐
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦