除了深度学习,你需要知道AI技术的23个方向 | 机器之心首份技术报告

简介: 在即将过去的 2017 年,深度学习技术蓬勃发展,AlphaZero 从「零」开始在多种棋类竞技上快速发展,DeepStack 与 Libratus 在德州扑克中击败人类高手,GAN 衍生出各种变体,语音合成从实验室走向产品,Vicarious 提出全新概率生成模型并击破人类的 CAPTCHA 验证码。

微信图片_20211129142946.jpg

在即将过去的 2017 年,深度学习技术蓬勃发展,AlphaZero 从「零」开始在多种棋类竞技上快速发展,DeepStack 与 Libratus 在德州扑克中击败人类高手,GAN 衍生出各种变体,语音合成从实验室走向产品,Vicarious 提出全新概率生成模型并击破人类的 CAPTCHA 验证码。这些令人振奋的进展将智能技术从实验室带到了产业及应用层面,「人工智能」及「深度学习」等概念也进入了大众视野并成为流行词汇。


作为国内首家系统性关注人工智能的科技媒体,机器之心在过去几年的报道工作中见证了深度学习引领的又一次人工智能浪潮以及大众关注的热情,与此同时我们也发现由于「AI Effect」的存在,有很多人忽略了深度学习之外的其它人工智能技术,对人工智能各种技术分类及基础概念、技术的历史进程和发展方向都缺乏成体系化的了解,导致对人工智能技术的整体发展趋势及「可用性」缺少宏观认识,并在试图采用人工智能技术进行产业革新时走了很多弯路。


因此,机器之心推出《人工智能技术趋势报告》,旨在帮助读者:


1)系统全面纵览人工智能(AI)的 23 个分支技术


2)明晰人工智能(AI)下各分支技术的历史发展路径,解读现有瓶颈及未来发展趋势。


3)分析人工智能(AI)下各分支技术在产业中的实际应用情况,评估其在「研究」、「工程」、「应用」、「社会影响」这四个阶段中所处位置,为计划使用人工智能技术的决策者提供决策参考。


4)为 AI 从业者提供技术趋势参考;产业方、初学者提供系统性的技术学习资料。



你将从报告中获得什么?


本报告所讨论的「人工智能」主要是指可以通过机器体现的智能,也叫做机器智能(Machine Intelligence)。在学术研究领域,指能够感知周围环境并采取行动以实现最优可能结果的智能体(intelligent agent)。一般而言,人工智能的长期目标是实现通用人工智能(AGI),这被看作是「强人工智能(strong AI)」。在处理交叉领域问题时,AGI 的表现会远远超过普通机器,并且可以同时处理多个任务。而弱人工智能(weak AI,也被称为「狭隘人工智能(narrow AI)」)无法解决之前未见过的问题,而且其能力仅局限在特定领域内。但是,人工智能专家和科学家现在对 AGI 的确切定义仍然含混不清。区别强人工智能和弱人工智能的常见方法是进行测试,比如 Coffee Test、图灵测试、机器人大学生测试和就业测试。


本报告所讨论的「技术(technology)」是一个范围广泛的概念,包含人工智能领域所使用的方法、算法和模型,我们将使用「技术」一词指代这三者。根据参考经典教材、书籍、论文、博客、视频和 MOOC(大型开放式网络课程)等材料,我们确定了 23 种不同的人工智能技术并将它们分成 4 大领域:


  • 解决问题(搜索)
  • 知识、推理和规划
  • 学习
  • 通信、感知和行为


微信图片_20211129142951.jpg


我们把上面列出的 23 种技术根据它们在人工智能领域内的基本机制、方法和应用相似度进行了分类。这些分类并不是互斥的。你可以将它们看作是人类具有的能力,每种能力都有不同的功能,共同协作才能实现更高级更复杂的目标。


技术发展阶段的分类方法有很多。现有的大多数方法都被称为「技术生命周期(Technology Life Cycles)」,其中也包括「衰落」阶段。但是,对于这份针对人工智能技术的特定研究报告而言,我们没有考虑「衰落」阶段。尽管我们认为一种特定技术的发展可能会在某个时候停滞,但其发展(在科学进步方面看)不会退步;对技术「衰退」的引证通常是在商业角度上考量的。根据我们对多个信息来源的评估和分析,我们确定了人工智能技术发展将会经历的四个周期:研究、工程、应用和社会影响。这里给出了每个阶段的详细定义,以作为未来详细分析的范式:


微信图片_20211129142954.jpg

注:实际上这里涵盖了很多技术的子类别,而我们将它们当作一个整体来确定它们的发展阶段。一旦有特定的迹象说明一种技术已经经过了一个特定的阶段,那么整个技术类别都将被置于该阶段——尽管对该技术可能还有一些持续性的研究、工程或应用工作。

微信图片_20211129142957.jpg


报告试读


微信图片_20211129143001.jpg


请点击放大阅读



多位大牛一致推荐


发布之前,我们特意邀请人工智能领域多位顶级专家进行了试读,并获得了他们的一致推荐。

微信图片_20211129143007.jpg

微信图片_20211129143010.jpg

微信图片_20211129143013.jpg微信图片_20211129143017.jpg微信图片_20211129143020.jpg微信图片_20211129143024.jpg


//

推荐语按姓氏拼音排序



我们需要你的参与


在这份报告的制作过程中,我们得到了数位一线研究者的协助,在此特别致谢。这份报告只是一个开始,在接下来的 2018 年机器之心将以这份报告为起点,推出更多的技术分析内容项目,并邀请感兴趣的读者加入我们,共同为行业带来更多优质内容。


加入方式:公众号回复关键词开放项目」,即可获得相关说明。


购买须知


  1. 报告语言:中文。
  2. 购买方式:点击阅读原文,即可购买。
  3. 如何阅读:购买报告后,点击机器之心公众号菜单栏「内容商店」进入阅读。
  4. 报告为虚拟内容服务,一经订阅成功概不退款,敬请理解。
  5. 如有其他疑问,请添加机器之心小助手Ⅱ:syncedai2。


目录
打赏
0
0
0
0
369
分享
相关文章
AI驱动的幼儿跌倒检测——视频安全系统的技术解析
幼儿跌倒检测系统基于AI视频技术,融合人体姿态识别与实时报警功能,为幼儿园安全管理提供智能化解决方案。系统通过YOLOv9、OpenPose等算法实现高精度跌倒检测(准确率达98%),结合LSTM时间序列分析减少误报,支持目标分类区分幼儿与成人,并具备事件存储、实时通知及开源部署优势。其高效、灵活、隐私合规的特点显著提升安全管理效率,助力优化园所运营。
AI驱动的幼儿跌倒检测——视频安全系统的技术解析
开源AI守护后厨——餐饮厨房视频安全系统的技术解析
餐饮厨房视频安全系统是一套融合开源AI技术与视频监控的智能化解决方案,涵盖实时检测、行为监测、数据分析、公众透明化及反馈闭环五大模块。系统通过YOLOv8、ResNet等算法实现后厨卫生与操作规范的精准监控,识别率达97%,问题响应时间缩短至秒级。同时支持后厨直播与监管对接,提升消费者信任和管理效率。其灵活开源的特点,为食品行业安全管理提供了高效、透明的新路径,未来可扩展至食品加工等领域。
AI 驱动下的阿里云基础设施:技术创新与产品演进
本文整理自阿里云智能集团副总裁、阿里云弹性计算产品线与存储产品线负责人吴结生在“2025 AI势能大会”上的演讲,重点介绍了阿里云在AI基础设施领域的技术创新与产品演进。内容涵盖CIPU架构、盘古存储系统、高性能网络HPN等关键技术,以及第九代英特尔企业实例、ESSD同城冗余云盘等新产品发布。同时,文章详细阐述了灵骏集群的优化措施和可观测能力的提升,展示阿里云如何通过持续创新为AI负载提供强大支持,助力企业在AI时代实现智能化转型。
AI 驱动下的阿里云基础设施:技术创新与产品演进
中国AI编码工具崛起:技术突围、生态重构与开发者新范式
中国AI编码工具如通义灵码、百度Comate等,正从西方产品的主导中突围。通过大模型精调、中文友好型理解及云原生赋能,构建差异化优势。这些工具不仅提升效率,还推动中国软件产业从使用者向标准制定者转变。然而,技术原创性、生态碎片化和开发者信任危机仍是挑战。未来目标不是取代现有工具,而是定义适合中国开发者的智能编码新范式。
74 23
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
38 8
数字化转型需要的技术:生成式AI时代的全栈能力图谱
本文探讨生成式AI推动下的数字化转型技术需求转变,从技术本质、实施路径、伦理规制三方面解构核心要素。技术本质从工具理性进化到能力体系,需建立模型思维、多模态交互和自主进化能力。实施路径分为认知重构、实验验证与迭代优化三个阶段。同时,文章介绍生成式人工智能认证(GAI认证)的战略价值,强调其在能力基准建立、技术合作及创新生态接入中的作用。最后,文章分析组织能力进化与未来技术前沿,如认知智能、具身智能和群体智能的演进方向,为企业提供全面的技术赋能与战略转型指导。
AI驱动的开源治理——社会综合治理智慧化系统的技术突破
通过AI识别与智能监控精准捕捉不文明行为,生成证据链并分级预警,识别精度达98%;跨部门联动平台打破信息孤岛,实现多部门高效协作,事件处置时间缩短至5分钟;多场景适配的开源架构支持景区、校园等多样化需求,灵活部署边缘计算优化性能。试点成效显著,大幅提升治理效能。
51 14
AI大模型进阶系列(03) prompt 工程指南 | 实战核心技术有哪些?
本文深入讲解了AI大模型中的prompt工程。文章分析了role角色(system、user、assistant)的意义,message多轮会话记忆机制,以及prompt的核心三要素(上下文背景、输入内容、输出指示)。同时介绍了多种提示优化技术,如少样本提示、CoT链式思考、prompt chaining链式提示、思维树ToT提示等,还展示了让AI生成提示词的方法,为实际应用提供了全面指导。
AI智能导诊系统开发技术解析
智能导诊系统基于人工智能、大数据和医疗信息化技术,优化患者就医流程,提升资源匹配效率。其核心功能包括智能分诊、症状自评与风险评估及就医路径规划,通过自然语言处理、医学知识图谱、多模态交互等技术实现精准服务。系统可将门诊误挂率从23%降至6%,并显著提高急危重症识别效率,为患者提供全流程导航支持。
AI技术在智慧工地中的应用有哪些?
人工智能技术(AI)通过算法和数据让计算机模拟人类智能,完成复杂任务。在智慧工地中,AI技术覆盖施工管理全流程,提升效率与安全性。主要应用包括:人员智能化管理(身份识别、行为监测)、施工安全管控(危险行为识别、设备监控、环境预警)、设备与物料管理(预测性维护、物料追溯)、施工效率与质量提升(进度调度、质量检测)及智能决策支持(大数据分析、虚拟培训)。这些技术推动建筑行业从经验驱动向数据驱动转型,助力无人化作业与全生命周期管理。
33 0