就在我们的头顶之上,各种卫星(包括间谍卫星)像狗仔队一样,每天都围着地球疯狂拍下数十TB的照片。这个数量可以说是泛滥了。
每个情报机构都有一批训练有素的分析师,负责搜寻隐藏在海量卫星图像中未申报的核设施或秘密军事基地。
但面对如此海量的数据,据说美国的情报机构已经被错失恐惧症(FOMO)所笼罩。因为人类分析员能处理的图像数量有限,很可能错失真正重要的关键信息。
于是,AI来了。而且来得很恐怖。
前不久,美国研究人员训练出一个深度学习算法,用以识别“东亚某国”地空导弹基地。
这些算法比人类的速度快几百倍,高效找出分布在一块近9万平方公里区域内的地空导弹发射场。这种人工神经网络基于能够过滤和学习大量数据的人工神经元层,达到人类图像分析专家90%的准确率。
令人震惊的是,这种方法还将发现潜在导弹基地的时间从60小时(2.5天)减少到42分钟。
可怕之处在于,这只是公开的“民间”研究。
“用算法发现潜在的导弹基地位置,据我所知,这为人类节省了很多时间” 密苏里大学电气工程和计算机科学教授Curt Davis谈了谈他们的研究方向。
这个研究发表在10月的《应用遥感》杂志上,展示了一种用于大量卫星图像分析的深度学习模型,能够识别情报机构和国家安全专家可能感兴趣的目标。
△ 美国爱国者地空导弹系统运输起竖发射车(TEL)
挑战
在卫星图像分析中应用深度学习AI的挑战通常很难解决。
与人脸、地点或者物体识别相比,卫星图像对深度学习算法提出了更大的挑战。因为卫星图像会从多个角度进行拍摄,同一地点的建筑物可能在照片上是颠倒的,另外同一地点的不同时间里云层的变化也很不一样。
另一个主要问题是相对缺乏大型训练数据集,包括用于训练深度学习算法的手工标记的示例,需要用它来准确识别卫星图像的特征。
对此,Davis团队将全球约2200个地点的公共数据与影响解决方案商DigitalGlobe卫星图像结合在一起,创建自己的训练数据,然后通过测试四种深度学习模型找到最佳测试数据。
但研究人员手中确认的地空导弹基地图片只有90个。这样一个小型训练数据集通常无法产生准确结果。为了解决这个问题,Davis等人将原始图像稍微改变了方向,把90多个训练样本转换成大约893000个训练样本。
这项研究中的成绩很可能得益于导弹发射基地占地很大,在卫星图像上看也有独特的图案。
△ 两类常见的原型/对称地空导弹发射场
挑战接踵而至。
卫星图像之间的分辨率也差异很大。这让问题进一步变得复杂,想要深度学习算法效果最好,通常需要给定相同大小的图片。另外,除了可见光图像之外,不少卫星拍摄的还是红外或者其他光谱波段的图像。
在试图分析诸如移动导弹发射装置、雷达天线、移动雷达系统和军用车辆等较小的物体时,深度学习算法面临着一个更大的挑战,因为可用的卫星图像数据在提取识别特征时像素会减少。
“在我们的大脑中,CNN如何处理这样的小尺寸物体是一个悬而未决的问题,尤其是在大型数据集的测试中,就像我们在这次研究中所做的那样。”Davis说。
未来
种种的不完善,让深度学习面临巨大障碍。即使算法能够达到80%或90%的精度,专家仍然认为AI不具备接管整个工作的能力。
今年7月以来,各路高手纷纷开始在全球最大的卫星图像公开数据集上训练机器学习算法。这个数据集包含100万个带标签的对象,包括不同的建筑和设施。
这个数据集的提供者,是美国情报高级研究计划局(IARPA)。他们赞助举办的这次大赛,就是想找到一个更好的AI解决方案,分担人类分析员75%的工作。
(量子位插播,大赛地址在此:https://www.iarpa.gov/challenges/fmow.html)
共有10个团队进入到这次挑战的决赛阶段,整个比赛要下个月结束。
IARPA的项目经理Hakjae Kim说:“美国情报机构的手里已经有了一些方案,但速度和方法总是有提升的余地”。
“现在的技术状态,只有人与机器合作才能真正找到答案”,笛卡尔实验室CTO麦克·沃伦(Mike Warren)说。笛卡尔实验室已经把深度学习用于分析商业卫星图像,对美国玉米和大豆的收成进行预测。
即使不完美的AI工具也会有助于情报收集工作。
例如,国际原子能组织(IAEA)的任务是监测所有已申报的核设施,并在近200个国家中寻找未申报的设施。
加州的米德尔伯里国际研究所研究员Melissa Hanham表示,深度学习工具可以帮助IAEA和其他独立组织利用卫星图像监测发展核势力和大规模杀伤性武器的发展。
“我们就处于这样一个世界,”Hanham说,“我期待自动化将工作中乏味而多余的部分取代。”
— 完 —