用机器学习分析美国新财年1万个国防项目,7054亿军费都投给了哪些技术?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 作者使用了一个机器学习文本分类模型,来尝试分析2020财年和2021财年预算之间新兴技术的资金变化,同时阐释每个类别的基础项目规划。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

image

2月10日,美国国防部发布了2021财年预算,概述了下一财年国防部的支出重点,总金额达到7054亿美元。

image

都说财年预算的目的是为下一场战争做准备,早在2018年,国防部就明确指出了为什么新兴技术对于美国军方的长期现代化以及与同等对手竞争的能力至关重要。

当时的财政预算文件指出,“前沿计算、'大数据'分析、人工智能、自主系统、机器人技术、定向能武器,高超音速和生物技术都是至关重要的”,以“确保我们能够打赢未来的战争。”

那么在这些方向上,哪些项目是最受重视的(预算最多),哪些项目又会面临资金不足的困境呢?

著名军事评论平台“warontherocks”上刊登了一篇文章,作者另辟蹊径,通过机器学习模型来分析国防部财政预算中超过10000多个研发项目,并给项目进行分类,统计各个项目的预算情况。他们发现:

  • 高超音速滑翔武器独占鳌头,总预算金额达33.6亿美元;
  • 生物技术的研制增加到10亿;
  • 定向能武器研究略有减少;
  • 量子计算大幅增加,但仍需加大投入。

用随机森林对10000个国防项目进行分类统计

作者使用了一个机器学习文本分类模型,来尝试分析2020财年和2021财年预算之间新兴技术的资金变化,同时阐释每个类别的基础项目规划。

在国防部网站上我们可以看到所有的财政预算子文件:

image

除了这些子文件,还有个各军种的数千页的预算文件,包括20多个单独的PDF。其中每个文件包含了各自的项目,每个项目规划的描述都说明了每年取得的进展,并说明了增加或减少预算的理由。

为了了解每种新兴技术的资金变化情况,研究人员从预算文件中抓取并清理了这些信息,然后将每个研发项目规划进行归类,包括人工智能、生物技术、定向能武器、高超音速武器和车辆、量子技术、自主和集群系统,微电子/5G以及非新兴类技术项目。

有许多种机器学习模型可用于对数据进行分类,为了选择最能有效地对项目规划数据进行分类的模型,研究人员编写了1200个程序,以测试模型随机森林、k近邻和支持向量机以及模型数据集。

每个模型都会查看规划说明中所有单词的词频,以决定如何对每个规划进行分类。例如,对于陆军的远程高超音速武器规划,该模型可能在描述中看到了“高超音速”、“滑行”和“热”字,并猜测这很可能是一个超音速项目规划。

随机森林模型的性能略胜于支持向量机模型,并且明显优于k最近邻模型,它也是一种仅在项目规划描述中查找特定关键字的简单方法,因此研究人员选择了随机森林作为最终模型。

选择了要使用的机器学习模型后,研究人员对现有的10000个项目规划进行分类。最终结果是2020年和2021年研发预算中提到的所有项目的一个大型数据集,包括规划的完整描述、预测出的类别和年度的预算资金。

通过按模型对项目规划进行排序和分类,各个新兴技术之间的预算差异清晰易见。

高超音速滑翔武器独占鳌头

国防部的官方预算新闻稿和新闻发布会声明了对高超音速武器的研究和开发投资。作为美国国防部的“前沿能力推动者”之一,高超音速武器和防御和相关研究在2021财年预算中获得了32亿美元,几乎是新闻稿中提到的其他三个优先规划项(微电子/5G、自主系统和人工智能)的总和。

在2021年的预算文件中,有96个项目规划(2020年预算中是60个项目规划)被模型分类为与超音速相关的,总预算合计33.6亿美元,比2020年的27.2亿美元大幅增加。

从军种来看,包括了陆军的远程高超音速武器、海军的常规突击武器和空军的快速反应武器。

陆军的远程高超音速武器获得了62042万美元的资金加持,用于实施一种“具有剩余作战能力的实验原型”。

空军的空中快速反应武器增加了1.8066亿美元,这是由于取消了2021财年空军的高超音速常规打击武器的资金——与2020财年相比节省了2.9亿美元。这是一个有趣的决定,值得进一步分析,因为两个相互竞争的规划的雄心和技术风险似乎有所不同:空中快速反应武器规划旨在“推动前沿可能性”,而常规打击武器则侧重于整合已经成熟的技术。

海军的常规突击获得了2021年资金预算中的最大一笔10亿美元,比2020年的预算申请增加了4.526亿美元。与陆军规划相似,海军常规突击预算的增加来自采购两个规划共享的“通用高超音速滑翔机体”和海军设计的34.5英寸推进器,以及在潜艇上进行的测试和集成。

可以肯定的是,2021年预算中的高超音速资金增加对于远程武器的现代化至关重要,而与高超音速技术相反,许多其他新兴技术的研发资金在2021年预算中或停止或下降。除高超音速技术外的所有新兴技术预算仅仅从2020年的78.9亿美元增加了1亿美元,其中主要是由于人工智能相关规划的增长。

生物技术增加至10亿

生物技术方面的预算从2020年的9.69亿美元增加到2021年的10.5亿美元。

这可能该模型高估了新兴生物技术规划的资金,其中包括了与士兵健康和医学相关的研究规划,涉及已经成熟技术。

国防生物技术的分析通常集中于人体增强、合成生物学和基因编辑技术等国防应用。以前的分析都对生物技术创新缺乏全面战略以及资金不确定性感到遗憾。战略与国际研究中心认为:“生物技术仍然是打击大规模毁灭性武器的投资领域,但在国防预算中似乎体现不出优先级。”

这些担忧似乎是有充分根据的,尽管纳米管、蜘蛛丝、工程益生菌和生物类传感器等生物技术提供了巨大的潜力,其中许多可能成为其他新兴技术的关键推动者,但资金却停滞了。例如,这里面包括一个有趣的“持久水生生物传感器”规划(2570万美元),该规划试图利用活性组织来监测沿海水域中的潜艇和无人水下航行器。

定向能武器研究预算略有减少

包括电磁武器在内的定向能武器的资金在2021年的预算中略有减少,从2020年的17.4亿美元降至16.6亿美元。

image

值得注意的是,陆军以2.46亿美元的价格采购了三个定向能原型机,以支持机动短程防空任务。

其他几个规划也值得注意。高能武器规划(1.0541亿美元)将完成设计并将系统集成到300千瓦级高能激光器原型中,以测试用于300千瓦级以及最终能达到500千瓦级的激光武器。

其次,空军的“定向能/电子战”规划(8903万美元)包括测试在复杂环境中使用的空中定向能武器。

量子计算的投入仍需加大

量子技术研究的预算到2021年将增加1.09亿美元,达到3.67亿美元。

总的来说,与量子相关的规划更具探索性,着重于基础研究和应用研究,而不是提供原型机器。它们通常也由国防部长办公室或国防高级研究计划局资助,而不是由单个服务部门资助。比如被模型分类为量子计算技术的几个项目,包括国防部长办公室的科学促进与技术优先发展的应用研究(5452万美元),以及国防高级研究计划局的功能材料和器件规划(2825万美元)。

国防部增加对量子技术的资助值得称赞,但鉴于量子技术具有潜在的颠覆性,美国应进一步增加其对量子研究和开发的联邦资助,保证长期稳定的资助,并激励年轻的研究人员投入该领域。

2021财年预算的资金增加显然是积极的一步,但是量子技术的革命性潜力使得国防部需要投入更多的资金。

自主系统预算降低,人工智能却大幅增加

2021年,被归类为“自主系统”或“群体编组”研究与开发的规划从35亿美元下降到28亿美元,其中包括陆军无人作战车规划(从2020年的8918万美元停滞在8622万美元)。

Skyborg自主无人机计划(低成本,发射后无需回收的无人系统)需要4090万美元,并且也属于“自主系统”类别,空军的“ Golden Horde”也是如此(7209万美元), 还有国防部长办公室的“无人驾驶”阿凡达组合计划(7140万美元)以及海军的低成本无人机编组技术(LOCUST)规划(3479万美元)。

但是与之类似的人工智能计划却有所增加,2021年,按模型分类为“人工智能”类别的规划从13.6亿美元增加到19.8亿美元。

这主要表现在一些小计划上,2021年人工智能方面有161个5000万美元以下计划,而在2020年是119个。

一些批评家认为,联邦拨款有可能会重复商业领域的人工智能工作,这种说法有几个问题。

2017年有关美国人工智能战略的报告指出:“在可预见的未来,对于商业化潜力有限或不太可能获利的研究和创业公司的资金资助也呈现短缺趋势。”其次,在人工智能技术从商业开发到国防应用的过渡中,存在许多技术,过程,人员和文化方面的挑战。最后,特朗普政府的反移民政策阻碍了美国技术和工业基础的发展,特别是在人工智能方面,“因为移民占据了美国四分之一的初创企业。”

长期看来,新兴技术的投入还不够

虽然有一些重要规划的个例,用以提高美国军方长期竞争力尤其是在高超音速武器方面,但总的来说,2021年的总体预算未能实现将研发经费转移到新兴技术和基础研究上的目标。

新兴技术的研发资金与2020年基本持平并不令人惊讶,美国已经比其他任何国家都花了更多的国防费用,即使预算保持不变,与2020年预算相比,新兴技术的资金分配也无法反映出对高端竞争的长期规划的更多重视。

具体来说,美国应增加对高超音速技术以外的新兴技术的投资包括定向能武器、生物技术和量子信息科学以及基础科学研究等,即使需要在其他领域进行权衡。

其实问题不一定是2020财年和2021财年预算之间的年度变化,相反,问题在于,对于美国国防部战略目标的研发支持,2021财年在新兴技术资金将延续上一年这一结果有点令人失望。

总的来说,作者认为,新兴技术的研究的预算规模与它该有的地位并不吻合。

相关报道:
https://warontherocks.com/2020/03/put-your-money-where-your-strategy-is-using-machine-learning-to-analyze-the-pentagon-budget/

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-04-08
本文作者:大数据文摘
本文来自:“大数据文摘”,了解相关信息可以关注“大数据文摘

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8天前
|
存储 人工智能 云栖大会
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
|
10天前
|
机器学习/深度学习 数据采集 分布式计算
大数据分析中的机器学习基础:从原理到实践
大数据分析中的机器学习基础:从原理到实践
51 3
|
3月前
|
机器学习/深度学习 数据可视化 大数据
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
314 15
|
3月前
|
机器学习/深度学习 数据采集 运维
机器学习在运维中的实时分析应用:新时代的智能运维
机器学习在运维中的实时分析应用:新时代的智能运维
112 12
|
3月前
|
机器学习/深度学习 传感器 运维
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
本文探讨了时间序列分析中数据缺失的问题,并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集,采用线性回归和决策树回归两种方法进行缺失值补充,并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示,决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳,而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣,并给出了实际应用建议。
177 7
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
|
3月前
|
编解码 机器人 测试技术
技术实践 | 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型快速搭建专业领域知识问答机器人
Qwen2-VL是一款具备高级图像和视频理解能力的多模态模型,支持多种语言,适用于多模态应用开发。通过PAI和LLaMA Factory框架,用户可以轻松微调Qwen2-VL模型,快速构建文旅领域的知识问答机器人。本教程详细介绍了从模型部署、微调到对话测试的全过程,帮助开发者高效实现定制化多模态应用。
|
4月前
|
机器学习/深度学习 算法 UED
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法。本文介绍 A/B 测试的基本概念、步骤及其在模型评估、算法改进、特征选择和用户体验优化中的应用,同时提供 Python 实现示例,强调其在确保项目性能和用户体验方面的关键作用。
81 6
|
4月前
|
机器学习/深度学习 Python
机器学习中模型选择和优化的关键技术——交叉验证与网格搜索
本文深入探讨了机器学习中模型选择和优化的关键技术——交叉验证与网格搜索。介绍了K折交叉验证、留一交叉验证等方法,以及网格搜索的原理和步骤,展示了如何结合两者在Python中实现模型参数的优化,并强调了使用时需注意的计算成本、过拟合风险等问题。
155 6
|
4月前
|
机器学习/深度学习 分布式计算 算法
【大数据分析&机器学习】分布式机器学习
本文主要介绍分布式机器学习基础知识,并介绍主流的分布式机器学习框架,结合实例介绍一些机器学习算法。
661 5
|
4月前
|
机器学习/深度学习 数据可视化 算法
机器学习中的特征选择与降维技术
机器学习中的特征选择与降维技术
160 0

热门文章

最新文章