近日,阿里巴巴与今日头条联合发布 2018 年科技趋势预测。15 位不同领域的科学家,对 IoT、量子计算、边缘计算、自然语言处理、区块链、自动驾驶等前沿技术将在 2018 年如何影响世界、影响社会生活做出了自己的预测。
15位科学家名单如下:
- 阿里云量子实验室首席科学家、之江实验室副主任施尧耘;
- 蚂蚁金服副总裁、技术实验室负责人蒋国飞;
- 达摩院机器智能实验室研究员朱胜火;
- 今日头条人工智能实验室总监李航;
- 达摩院机器智能实验室 NLP 首席科学家司罗;
- 达摩院机器智能实验室语音技术总监鄢志杰;
- AliOS 首席架构师谢炎;
- 今日头条人工智能实验室总监李磊;
- 阿里巴巴 AI labs 杰出科学家王刚;
- 阿里巴巴 AI labs 杰出科学家聂再清;
- 蚂蚁金服首席数据科学家漆远;
- 达摩院机器智能实验室副主任华先胜;
- 今日头条人工智能实验室总监王长虎;
- 达摩院机器智能实验室主任金榕;
- 达摩院机器智能实验室副主任任小枫。
施尧耘
阿里云量子实验室首席科学家、之江实验室副主任
2018 年量子计算的第一幕高潮应该是「量子霸权」:多个超导,甚至可能有离子阱团队将纷纷宣称实现了经典计算机无法模拟的量子处理器来。而经典模拟能力可能在新的理论突破下大大提升,重设霸权之争的起点。今年可能见证第一个拓扑比特的诞生。而其他如超导、离子阱等方向颠覆性新思想的种籽可能会在今年无声地落地。量子软件因为门槛低,将会继续蓬勃发展。量子算法的论文会百花齐放,但大多数不过是组合拳。
量子-经典在密码上的擂台今年会愈演愈烈。经典密码苦修多年「后量子密码学」,终于把秘籍练到实用,大显抵抗量子攻击的能力和不需任何额外投入的成本优势。作为对策,小型、廉价的量子密码产品可能在今年出现,叩开近距离量子密码规模化市场。
蒋国飞
蚂蚁金服副总裁、技术实验室负责人
如果说 2017 年是 AI 爆发「元年」,那么 2018 年,我们可能会见证 IoT 应用的大爆发。受益于 IoT 市场的爆发,用户体验空前提高,但传感器的融合以及由大量传感器带来的数据运算和处理,会成为新的课题。
大批前端 IOT 传感数据处理的需求会推动边缘计算的快速实现。巨量的、分布式的和轻小 IOT 设备对整个系统安全管理带来空前挑战。在 2018 年,图像,视频和语音等交互技术的进展能让机器更加「懂」你。更多的生物特征识别技术将取代密码。随着传感器数量的爆发式增长,大量的 IoT 数据前所未有的把物理世界映射到虚拟网络中,结合数据挖掘和人工智能技术,能够让我们更精确的了解这个世界和我们自身。
2018 年业界会持续高度关注区块链技术发展。在金融服务和供应链管理等场景中,一些区块链应用会从概念性证明阶段(PoC)落地到实际商用系统。越来越多的传统行业会思考已有商业模式,拥抱尝试区块链技术。共识机制和网络决策等核心技术发展会持续改善区块链系统的性能和规模。在比特币和以太坊后,会出现第三代区块链技术架构。零知识证明等方面的进展会改进区块链系统上的安全和隐私模型,进一步解决互信和隐私的矛盾。此外,在多个平台共存的情况下,跨平台多链互联,实现跨链价值转移和数据交换会成为区块链技术的一个重点。
朱胜火
达摩院机器智能实验室研究员
两个趋势:
面向消费者的 AI 技术(智能音响、翻译机等)继续蓬勃发展,商业的 AI 技术从边缘走向核心。
四个挑战:
1)边缘智能的发展要解决在受限环境下对模型的优化与计算能力的提升,这两部分是要联合起来继续优化才有质的突破。
2)复杂决策的智能一部分可以用增强学习解决,但很多商业核心决策是非常复杂的,需要方法来学习行业专家的决策以及迭代提升机器决策。
3)提升 AI 技术与人的交互体验,狭义上的人机交互,广义上也反应在政治经济伦理安全上,包括机器智能的「歧视」问题,机器决策的责任可解释可述源。
4)因 AI 人才培养滞后带来人才等商业成本上升,AI 的 ROI 面临高估风险。
李航
今日头条人工智能实验室总监
2018 年 NLP(自然语言处理)将在翻译、问答、对话等几个方面继续取得巨大进步。大胆预测,未来一年对话系统将能更好地理解人类语言,更自然地与人类通过语言交互。对话方面令人震撼的突破可能来自以下几个场景。
一是实现多系统对话(multi-systems dialogue):多个对话系统集体与用户进行对话,共同完成一项任务。比如,多个不同的问答系统,协同回答用户的问题,帮助用户更好地找到答案。
二是实现多媒体中的对话(dialogue in multi-media),人通过自然语言发出命令,同时做出示范性动作;机器人通过对命令以及对视频中动作的理解,快速学习如何完成一个任务。比如,教机器人如何开门。
三是实现模仿语言学习(imitation language learning):人为对话系统做出一定的示范,在什么样的场合下用什么样的自然语言进行对话,对话系统能够很快地学到对话的策略。比如,人类客服指导对话系统提高对话技巧,使系统能很快地在一个新领域承担自动客服任务。
司罗
达摩院机器智能实验室 NLP 首席科学家
2018 年初,我们机器阅读理解技术(精准匹配)首次小幅超越人类,这个里程碑让研究人员看到了希望。但对于机器「能理解会思考」的终极目标来说,这只是万里长征的开始。迁移学习等技术的大量使用会催生更多好成绩,语言学知识或知识库知识在机器翻译模型中被更好的整合,单语语料和可比语料会更多用于稀少资源语言的翻译中; 信息抽取技术会从纯文本通用类型信息抽取更多走向富媒体(文字,表格,图片等)和垂直领域的信息抽取。可以预见,未来人类会习惯机器在更多特定领域的「超人」成绩,但机器短期内达到人类思维的深度和广度还有待时日。
鄢志杰
达摩院机器智能实验室语音技术总监
从 2018 年开始,人类与机器的交互方式将开始彻底摆脱任何形式的交互界面,变得更接近人与人的交互。这背后是对听觉、视觉、触觉,甚至味觉等多模态技术的全面融合。机器将能感知到人类在语气语态、肢体动作、面部表情等更丰富的表达方式,从而更智能的理解人类的意图。生活空间、交通空间、工作空间将是三个首先落地领域。
谢炎
AliOS 首席架构师
2018 年移动互联网时代将正式结束。越来越多带麦克风、摄像头、屏幕或更多传感器的智能终端将出现,并具备联网、交互、语音、视觉等能力,向泛 AI 化靠拢,很多工作、娱乐生活不需要通过手机完成,AI 智能硬件设备的活跃量将迎来爆发式增长。
2018 年人们花费在单一终端设备上的时间将大幅下降,智能手机用户活跃时长或将出现近年来的首次负增长。与之形成对比的是,包含智能手机在内的智能终端设备总量将继续增长,用户在线时间将更加碎片化。
李磊
今日头条人工智能实验室总监
2018 年,摄像头、红外摄像、麦克风、陀螺仪加速计等多传感器的协同分析会大大提高对场景、空间定位、人物、动作、意图的理解。随着手机、电视、音箱、耳机、手表等各种终端计算能力的加强,理解人物行为的能力今年会有很大希望移植到端上,从而做到实时理解与视频创作。
机器学习方面今年的一个趋势是,不仅仅优化模型性能,而且会在训练和推理过程中引入反馈和人工修正,在人机协作智能(human-in-the-loop machine learning),交互式机器翻译方面 (Interactive machine translation) 今年会有更多方法尝试优化模型与人的实时反馈动作,最终达到更好的综合性能。基础研究会有更大突破,逐步解开深度学习的黑箱,提高机器学习模型的可靠性、稳定性以及可解释性。
王刚
阿里巴巴 AI labs 杰出科学家
2018 年会是自动驾驶大面积铺开的一年。从应用场景上来看,任意道路上的 L4 自动驾驶(无人驾驶)仍然面临很大的挑战,而低于 L3 级的自动驾驶(辅助驾驶),并不能脱离人的接管和操控。因此在限定场景的无人驾驶会在 2018 年率先落地。由于政策对人工智能行业的大力支持,未来几年内,中国的自动驾驶极有可能超越美国。人类并不是未来车辆的司机,他们是「贵重的货物」。从行业趋势来看,越来越多的研发资源会被投入到改善综合的交通环境中,即感知和理解更广的交通场景的人,车,物,以及它们的行为。
聂再清
阿里巴巴 AI labs 杰出科学家
2018 年一个非常清晰的趋势是,智能语音助手随着智能音箱和 IoT 设备的普及进入人们的日常生活。过去 10 年,移动互联网时代带来的最典型的社会现象是低头族变多,智能手机将在线与离线的界限变得模糊,物理世界通过手机这个入口,开始被数字化重构,这是虚拟世界的「原始积累」阶段。未来 10 年将是人工智能的时代,智能语音助手会在 2018 年迅速进入人们的生活,作为用户在虚拟数字世界的」替身」,帮助人类处理大量重复性的工作,让大家有更多的时间来进行创新。2018 年,自然语言处理技术还将在与用户的海量交互中自我迭代,使得 AI 可以更自然的使用人的语言和人类进行交流,并更精确的接受和理解需求,这将进一步带来社会创造力和生产力的解放。未来人类会越来越习惯与物理世界对话,预计五年内人机语音交互频次将超过触控交互频次。
漆远
蚂蚁金服首席数据科学家
2018 年,人们对 AI 会更关注落地,大家的关注点会从下围棋和图像识别等比赛型活动慢慢转移到用 AI 真正解决世界面临的问题。在这个背景下,不少 AI 创业公司会面临挑战。但大浪淘沙下会有活下来的创业公司,这些公司和成功转型的「传统」企业可能会成为未来的产业领导。金融行业,作为一个和数据与信息密不可分的行业,会受到 AI 浪潮的更大更直接的冲击,从风控到理财到贷款等各个业务都会受到 AI 的巨大影响。数据和算法的结合会逐步重塑金融业。
其次,AI 芯片之战会越来越热;在云端和 edge 端,更快更省电的支持深度学习和其他机器学习的芯片会被研发出来,超越今天的 GPU 和 CPU 框架。这个方向上,大小芯片厂商都有机会,但最后会慢慢收敛到个别几个赢家。
第三,在深度学习收购了大数据红利后,AI 的技术关注点从深度学习逐步扩展到强化学习,小数据学习,图算法,可解释性,模型压缩等其他方向。更多的机器学习技术会在工业界得到发展与应用。
华先胜
达摩院机器智能实验室副主任
计算机视觉依然会是人工智能的热点方向,除了安防和交通领域,视觉技术在工业、农业、环保等行业的应用将会逐步为更多人所知晓和认可,也会逐渐变成红海。随着 AI 在上述行业的大量应用,人机竞争有可能在一定程度上激化,部分相对简单脑力劳动力面临失业或转行,但最终会以人力转向新的产业而得以缓解。
医疗视觉依然会是大家追捧的热点,医疗行业的从业者开始入局,行业经验和扎实技术合力、人机合力的从业者将形成这个方向的壁垒。总的来说,AI 将深入各行各业,发掘各个行业的问题和机会,同时带来生产力的改变。但没有迹象表明人类会被 AI 取代,相反 AI 会显著提升人类整体的生活和生命质量。
王长虎
今日头条人工智能实验室总监
2018 年,信息分发领域将持续蓬勃发展,并进一步呈现出多样化的趋势。新闻、文章、问答、图像、视频、直播、语音等个性化内容,将越来越多的占用用户的碎片化时间。计算机视觉、视频理解、自然语言理解、语音识别等 AI 技术将深度整合,并深入于多媒体信息流的每个环节,从而显著提升信息生产者和消费者的创作体验和生活质量。细粒度的深度视频理解,将成为计算机视觉领域的重要课题,并将广泛应用于内容辅助创作、敏感内容检测、个性化信息推荐、信息消费与互动、信息流广告等视频分发的每个环节。个性化推荐算法将进一步升级,短时兴趣与长期兴趣共举,经济效益与社会效益并重,从而再次推动整个产业的发展。
金榕
达摩院机器智能实验室主任
如何将大数据的方法与知识图谱及语言学知识有机结合以提升对文本内容的理解在 2018 年会变得越来越重要。机器视觉方面,提升识别多样性会是一个重要研究方向。语音领域与之类似,需要能对不同口音、方言、噪声,都能自我调节到最佳的识别唤醒精度。在机器学习方面,过去的研究主要集中对硬件端优化以及算法/模型端优化,未来的工作将会对硬件和算法进行更紧密的联合优化,以提升深度模型的推理效率。
任小枫
达摩院机器智能实验室副主任
2018 年人工智能必须,也必定会走向实际的产业应用。个人预测:
(1)视频理解和编辑技术的进一步成熟将推动整个视频产业的长足发展,包括精准和个性化的搜索推荐,以及视频生成和交易的正规化和品质化;
(2)「刷脸」技术将在 2018 年成为常态,在众多场景中落地,真正走进生活的方方面面;
(3)新零售的各个场景中,以视觉为核心的智能技术将得到广泛应用,带来购物体验的质的变化;
(4)无人车,各大汽车厂商都将有原型车发布,自动驾驶将从探索大步走向实用;
(5)个人机器人,在多年研发和软硬件准备后,将会看到多种形态多种功能的机器人走入家庭,改变人们的生活方式。
原文发布时间为:2018-02-07
本文作者:奕欣
本文来源:雷锋网,如需转载请联系原作者。