杨强教授PPT通俗易懂解密:如何在人工智能浪潮中少走弯路

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

近两年人工智能技术的研究与应用骤然增速,产业界,无论是身经百战的科技巨头,抑或是默默无闻的中小企业,都想要抓住这一难得的机遇,在业内崭露头角。但是,如何将人工智能与自身原始的商业模式相结合,实现产业创新,很多企业都还在“摸着石头过河”,难免遇到迷茫期。

在2016年GAIR大会上,杨强教授深入浅出地为大家分享了自己多年来的智慧与经验总结——人工智能要取得成功应当具备的五个必要条件,这五个条件将成为推动人工智能长足发展的动力源泉。

杨强,香港科技大学计算机与工程系教授,IEEE Fellow,IAPR Fellow,AAAS Fellow和ACM杰出科学家。,第四范式首席科学家、机器学习领域国际学术带头人,主要研究领域为机器学习、数据挖掘和自动规划。到目前为止,杨教授在学术研究中硕果累累,在人工智能和数据挖掘方面,已发表了超过了200篇的学术文章,还组织筹办了多个人工智能和数据挖掘的国际会议。


当下人工智能在图像识别、语音识别和大规模的产品推荐方面取得了巨大的成功,那么人工智能的成功应用究竟取决于哪些条件?

为什么只在我们这个时代迎来了人工智能发展的高峰期?对于这两个备受关注的问题,杨教授从人工智能的科学与应用两个方面着手,娓娓道来。

人工智能的科学与应用——相辅相成


人工智能技术的发展大体可以分为两个方面:人工智能的科学与人工智能的应用。

从科学层面谈及人工智能要回归到该研究领域最根本的问题:机器能够思维吗?这个问题最早起源于人工智能之父图灵,之后经过60多年的努力,计算机科学家及各行各业对人工智能感兴趣的人士都竞相研发计算能力更强的计算机,汇聚更多的数据,提出更高级的算法,致力于回答这个最基本、也是最重要的问题。

谈到应用层面,除去人工智能已经为我们的生活带来的便利,我们更关心它对人类未来生活将产生什么样的影响。要将人工智能技术成功地应用于商业领域,既要站在科学前沿,也要具备一定的商业头脑,两者兼备才能在商业浪潮中立于不败之地。

人工智能取得成功的五个必要条件


会上,杨教授言简意赅为我们分享了决定人工智能成功的五个必要条件:

清晰的目标(商业模式)

高质量的大数据 (持续反馈)

清晰的问题定义和领域边界

懂人工智能的跨界人才(擅长应用和算法)

计算能力

首先,要有“清晰的目标”,即清晰的商业模式,这就好比游戏中明确规定何为赢,何为输,延伸到人工智能在商业领域的应用,即要确定明确的运行模式和运行目的。

其次,高质量的大数据资源是人工智能成功的核心条件。杨教授特别强调,高质量的数据要求收集到的数据能够具备持续性、反馈性,且反馈的方式与内容要与具体的算法相匹配。有人会觉得,在某个领域拥有了几千万个数据样本便具备从事人工智能的条件了,杨教授认为,这种观点是站不住脚的,原因如下:首先,已收集的数据样本可能无法与某个特定的算法相匹配;其次,所用到的算法可能不具备可持续性;最后,得到的反馈方式与内容不一定与期望相符。

第三,清晰的问题定义和领域边界。要求在应用人工智能技术时要对所遇到的问题有清晰的理解与定义,就像下棋一样,在有限定的领域里完成特定的行为操作。

第四,人工智能成功的核心竞争力在于懂人工智能的跨界人才(擅长应用和算法),即我们需要一个既精通人工智能,又在商界游刃有余的人才。当然,很多人会质疑:我们到哪里去找这样的人才?杨教授号召我们做生活中的有心人,善于关注身边会学习的人,着重培养其跨领域才能,这样的人才将具备把两个看似不同的垂直领域联系在一起的能力,在未来能够做出突出的成就。

最后,杨教授提出,强大的计算能力是人工智能技术在各领域成功应用的硬实力。在计算能力方面,我们有云计算、并行计算、GPU,这都为人工智能的发展奠定了坚实的基础。

人工智能已经取得的成就——强化学习与迁移学习

此外,杨教授提到,人工智能已经在机器学习领域已经取得了突出的成就,特别是在深度学习方面,此外,还特别强调了强化学习与迁移学习的应用前景。


强化学习

杨教授讲到,强化学习的优点在于它不仅能够学习人的行为,而且能够更好地使用延迟反馈功能。以Google DeepMind采用的强化学习流程为例,我们可以将这个流程图理解为一个计算机内部的表达形式,一个矢量,这个矢量与我们得到的反馈信息相结合,将有助于改进我们采用的策略。流程图中的策略,简单来讲,就是我们平常的行为规划,工作规划,就好比游戏中的一个动作就对应一个策略,这个策略再返回来,产生一个新的界面,如此我们便能够进行持续学习。在这个循环过程中,我们只有到最后才能够获得反馈,称之为延迟的反馈。就好比我们投资一只股票,过了很长时间才知道收益如何。


但是,这个循环暴露出强化学习的一个局限性:人们永远无法准确定义这个策略里的空间,我们称之为“状态空间”,即强化学习的结果具有不可预测性。说到这里,杨教授以Google DeepMind的第二个目标——端到端的深度学习为例。当该有的状态预先在学习器内表达好后,就形成了一种从输入端到输出端的端到端的深度学习模型,经过几百次的训练学习后,机器将能够学会如何更好地玩一个游戏。


以下各个图对应不同游戏的学习效果。图中横轴表示随着游戏轮数越来越多,机器的自学习效果不断提升,直至达到上限。


迁移学习

迁移学习是深度学习与强化学习的结合体,能够将适用于大数据的模型迁移到小数据上,实现个性化迁移,这样一来能够避免数据寡头的出现。

杨教授提出一点:

大数据设计出来的模型用于小数据上,它的副产品就是个性化。这就是迁移学习的目的。

运用迁移学习把在一个数据领域已经建立的非常好的模型,应用到另一个领域,这样既节省了资源,又能够节省时间,效果又好。


杨教授谈到,我们人很自然就具备这种举一反三的迁移能力,比如我们学会骑自行车后,学骑摩托车就很简单了;会打羽毛球,再学打网球也就没那么难了。

在演讲中,杨教授总结了迁移学习的四种实现方式,每一种方式都很直观。


第一种为样本迁移,就是在数据集(源领域)中找到与目标领域相似的数据,把这个数据放大多倍,与目标领域的数据进行匹配。样本迁移的特点是:1)需要对不同例子加权;2)需要用数据进行训练。


第二种为特征迁移,就是通过观察源领域图像与目标域图像之间的共同特征,然后利用观察所得的共同特征在不同层级的特征间进行自动迁移。


第三种为模型迁移,其原理时利用上千万的图象训练一个图象识别的系统,当我们遇到一个新的图象领域,就不用再去找几千万个图象来训练了,可以原来的图像识别系统迁移到新的领域,所以在新的领域只用几万张图片同样能够获取相同的效果。模型迁移的一个好处是我们可以区分,就是可以和深度学习结合起来,我们可以区分不同层次可迁移的度,相似度比较高的那些层次他们被迁移的可能性就大一些。


第四种为关系迁移,比如社会网络,社交网络之间的迁移。


迁移学习的最终目的就是实现AI for Everyone。比如我们利用一个由训练三万个的对话模式获得的大对话模型可以迁移到个人的小型对话中,这种基于强化学习所获取的个性化效果非常具有实用性,因为我们不用繁琐地问用户很多同样的问题。此外,杨教授在会上曾提到一个愿景——利用迁移学习,即使是自身没有条件获得大量训练数据的小公司也可以按照自己的需要应用大公司训练出来的模型,从而普及AI的应用,从而克服数据“寡头”现象。不论怎样,迁移学习是一种极具潜力的解决方案,将在未来大显身手。

运用“魔镜对话系统”实例阐释人工智能成功的五个必要条件

此外,杨教授用一个人工智能技术应用的热点——对话系统,清晰地阐明上述五个条件对人工智能技术发展所产生的推动性作用。

现有对话系统的应用原理

一般来讲,市场上现有的对话系统可以分为两类:闲聊类与功能类。


在上图中,我们可以看到:60年代的Eliza与微软的小冰属于闲聊类对话系统,百度的小度与微软的Cortana介乎闲聊类与功能类之间,Facebook的M与HKUST最新的Magic Mirror系统属于功能类对话系统。杨教授讲到,我们大家应该都有体验,微软小冰很幽默,但是也只能止于闲聊;功能类对话系统则给我们的生活带来了很多便利,例如,我们打电话到酒店预定房间,在银行办理个人业务,不过,在一定程度上,目前的功能类对话系统依然存在一些不太便利的地方,例如,在使用过程中,我们要根据系统提醒依次按服务键,这可能导致用户体验下降。

从技术层面上进行分析,杨教授提到对话系统可以大致分为两种:基于原则的系统与基于学习的系统。最早的对话系统是基于原则的,有很多专家来制定这些规则,其优点在于准确性高,但是却难以扩展,与数据无关,对数据的灵敏度不高。此外,基于原则的对话系统的由于无法扩展,通常情况下不能应对不同的意外事件,所以现在大家关注较多的是基于机器学习算法研发的对话系统。

三层结构算法模型将为对话系统带来革新


杨教授透露说,香港科技大学实验室正在研究如何运用新技术来改进现有的对话系统。在大会上,杨教授向我们展示了一个三明治式的三层结构算法模型:

第一层是我们熟知的深度学习神经网络——递归深度神经网络(RNN)

第二层是一个策略学习器——强化学习(RL)

第三层是迁移学习(TL)

在演讲中,杨教授特别强调了强化学习(RL)中最难的阶段:人工智能机器人只能部分观察周围的世界,研究者用一个奇怪的名字来描述这种现象——基于部分观察的马尔可夫决策过程。迁移学习(TL),正如在前面讲到的,能够将一个已经做好的模型迁移应用到一个新的领域中。杨教授讲到,希望利用这样一个三层结构赋予对话系统以下功能,比如说闲聊、推荐、引导、提醒、学习,如果一个对话系统能够具备这些功能,它就像一个真人一样。

但是,如何达到这个目的呢?


根据杨教授的观点,首先,对话系统应当具备基本的对话功能,即自然语言生成能力,这种能力主要依赖RNN来实现。

其次,我们需要一个策略,用这个策略引导对话的对象来完成一个特定的任务,即对话控制,主要通过RL实现。

最后,要实现个性化,满足用户不同的需求指令,主要依靠TL实现。


为此,杨教授给我们提供了一个实例,香港科技大学现在和一个O2O的公司合作,用真是的数据训练这个对话系统,上图中绿色代表用户所提的问题,白色代表系统的回答,该系统的中文名字叫做“魔镜系统”,就是童话故事白雪公主里面的魔镜,当然这是一个好的魔镜。“魔镜系统”是个性化学习的一个实例。

在这个系统中,我们是把整个对话系统放置在一个机器人里面,让机器人通过语音的方式与用户对答,实际上,这个系统可以在手机上与人进行交流。杨教授的研究团队将“魔镜系统”与大家熟悉的一些对话系统作对比,下图中,绿色代表用户的问题,黄色是小冰的回答,可以看到相比之下,小冰的回答多富有调侃性,准确度很低,而之前“魔镜系统”的回答更容易满足用户的需求。此外,我们还可以看到siri(灰色)的回答很多都是“抱歉没有找到匹配”,因为siri是基于搜索的对话系统。


杨教授表示,他们之所以对这种对话系统进行研究,归根到底是对背后的系统感兴趣,即我们在刚开始讲到的——人工智能成功的五个必备条件。在对该对话系统背后的原理进行剖析,可以发现,其研究团队具有很明确的目标,有很好的反馈,有不断到来的数据,有跨界人才,此外,和O2O公司有联络。


谈及清晰的问题定义与领域边界这个必要条件,杨教授表示,我们不一定像在下围棋一样,要确定明确的边界,在这里我们可以考虑说当我们现在的谈话进行到这里时,到底离我们的目标还有多远,这就好像在下棋里面一样,我们对当前的盘面有一个估算,同时我们可以接着往下问不同的问题,就像我们下面要下的棋子一样,所以对话系统的问题定义与领域边界问题实质上与Alphago的思维很相像。

杨教授讲到,同深度学习、强化学习及迁移学习一样,这个三层结构算法模型也具有通用性。比如杨教授的学生就把这种模型应用到大家公认的很难的领域中——预测股市走势。下图所示为A股里面的某个股票,用过去十年的数据训练该模型。首先,运用数据之间的连接,产生不同的状态,让各个状态之间能够互相迁移。其次,不同状态之间将发生变化,我们运用用一个强化学习器模拟这种变化。最后。我们发现深度学习的隐含层里面会自动产生几百个状态,基本就能够对这十年来的经济状况做出一个很完善的总结。所以,运用这种三层结构算法模型可以很好地对股市走势作出预测,对此,我们也做了一些相关测试。


杨教授表示,这个例子只是在金融领域的一个小小的试验。不过,一旦我们对一个领域有了透彻的了解,并掌握更多的高质量数据,就可以将人工智能技术迁移到这个领域来,在应用过程中对所遇到的问题作清晰的定义,最终能够实现通用型人工智能的目的。

总结


在演讲接近尾声时,杨教授对所讲的内容做出总结:通过同大家分享谷歌DeepMind的应用实例,讲解强化迁移学习和三层结构算法模型,及个性化学习,最终我们都要回归到人工智能成功的五个必要条件——清晰的商业模式(明确的目标)、高质量的大数据、清晰的问题定义和领域边界、懂人工智能的跨界人才及计算能力,这五个条件相互影响,缺一不可,是人工智能技术长足发展的动力机。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
1月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
50 12
|
2月前
|
人工智能 算法
人工智能浪潮中的伦理困境:我们如何确保技术的道德发展?
【10月更文挑战第22天】在人工智能(AI)技术的迅猛发展中,伴随着巨大的潜力和便利性,也出现了众多伦理问题。从数据隐私到算法偏见,再到自动化带来的失业问题,AI的每一步进步都在考验着人类社会的道德底线。本文将探讨AI技术发展中的主要伦理问题,并讨论如何通过制定标准、教育和跨学科合作来确保AI技术的道德发展。
|
3月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮中的编程教育革新
【10月更文挑战第21天】在人工智能飞速发展的今天,编程教育正面临着前所未有的变革。本文通过探讨AI技术对编程教育的深远影响,以及如何利用这些技术优化教学过程,旨在启发读者思考教育的未来方向。我们将一起探索从基础语法学习到复杂算法应用的转变,并讨论如何培养适应未来社会的创新人才。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能:引领技术革命的新浪潮
【10月更文挑战第14天】 在科技日新月异的今天,人工智能(AI)已经成为推动社会进步的重要力量。本文将探讨AI技术的发展现状、应用领域以及未来趋势,旨在为读者提供一个全面了解AI技术的窗口。
45 2
|
4月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程新范式
【9月更文挑战第27天】在AI技术飞速发展的今天,编程领域也迎来了新的变革。本文将深入探讨AI如何改变编程范式,以及这种变革对程序员和整个软件开发行业的影响。通过分析AI技术的特点和优势,我们将揭示它如何为编程带来更高效、智能的解决方案,并展望这一趋势对未来软件开发的深远影响。
73 2
|
4月前
|
人工智能 搜索推荐
人工智能浪潮下的伦理困境:我们如何应对?
在人工智能技术飞速发展的今天,它不仅改变了我们的生活方式,更引发了深刻的社会伦理问题。本文旨在探讨AI技术带来的伦理挑战,包括隐私泄露、就业置换、决策透明度和机器自主性等议题,并提出相应的对策建议,以期为AI技术的健康发展提供指导。
|
4月前
|
人工智能 算法 自动驾驶
人工智能浪潮下的伦理困境:我们如何面对?
随着人工智能技术的快速发展,其在医疗、交通、教育等多个领域的应用日益广泛。然而,技术的突飞猛进也带来了前所未有的伦理问题,如隐私泄露、算法偏见和责任归属等。本文将探讨人工智能带来的伦理挑战,并分析如何在享受技术红利的同时,有效规避潜在的道德风险。
132 4
|
4月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的编程实践:从Python到深度学习的探索之旅
【9月更文挑战第6天】 在人工智能的黄金时代,编程不仅仅是一种技术操作,它成为了连接人类思维与机器智能的桥梁。本文将通过一次从Python基础入门到构建深度学习模型的实践之旅,揭示编程在AI领域的魅力和重要性。我们将探索如何通过代码示例简化复杂概念,以及如何利用编程技能解决实际问题。这不仅是一次技术的学习过程,更是对人工智能未来趋势的思考和预见。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的浪潮之巅:探索人工智能的未来之路
在本文中,我们将一起踏上一场关于深度学习的奇妙之旅。从基本概念到最新应用,我们将一探究竟,看看这项技术如何改变了我们的生活和工作方式。无论你是科技爱好者,还是对人工智能充满好奇的新手,这篇文章都将为你揭开深度学习的神秘面纱,让你对这个令人兴奋的领域有更深入的了解。那么,让我们一起开始吧!