【清华 AI 公开课】IJCAI理事长杨强:人工智能在企业的落地是一门大学问

简介: 雅达利(Atari)公司的联合创始人Ted 逝世。“雅达利”这个名字,是人工智能历史上一个不可忽视的关键词。

在课程开始,雷鸣老师先概述了对产业有较大影响的技术,以及未来将发生的演变。

从技术角度看,未来对产业产生比较大影响的技术有:

d47e62d2b349aca45e42305ed6714efbe5ed61d9基于视频的信息理解和处理技术 。现在,基于静态的图片的处理技术,比如人脸识别、物体识别等,已经达到了可用的水平。但是,在视频分析和处理方面的研究才刚刚开始,还没有非常有效、成熟的技术。
d47e62d2b349aca45e42305ed6714efbe5ed61d9自然语言对话、理解和处理 。尤其是半开放环境的对话,难度还很大。
d47e62d2b349aca45e42305ed6714efbe5ed61d9强化学习 。未来将在自动驾驶、广告等领域产生影响。
d47e62d2b349aca45e42305ed6714efbe5ed61d9内容生成相关技术
d47e62d2b349aca45e42305ed6714efbe5ed61d9小样本学习和迁移学习 。在样本匮乏的情况下解决问题。

产业在未来可能发生的一些演变:

d47e62d2b349aca45e42305ed6714efbe5ed61d9 首先是 自动驾驶 。以前我们还会讨论自动驾驶是不是有落地的可能,是不是太危险、太科幻了。但现在来看,我们认为自动驾驶的落地只是时间的问题。今年很快,百度的小批量量产自动驾驶汽车就会投入使用,真正实现商业化。
d47e62d2b349aca45e42305ed6714efbe5ed61d9 第二是 智能医疗 。智能医疗最近的发展很快,以医学影像的发展为牵引,在一些特定领域的进展很不错。FDA最近刚给出了AI诊断的第二个license。
d47e62d2b349aca45e42305ed6714efbe5ed61d9智能教育 。探讨教育的难度比较大,因为教育不是一个客观问题,是一个交互式的,高维度的问题。所以AI全面介入教育的“智能老师”难度很大,但是以个性化教育作为切入,在一些特定领域,比如作文评分、作业批改、个性化出题等,已经在不断改变教育的生态。
d47e62d2b349aca45e42305ed6714efbe5ed61d9智能助理 。去年开始进入一种非常白热化的竞争阶段,未来会进一步的落地,通过迭代,会在更多垂直应用上越做越好。
d47e62d2b349aca45e42305ed6714efbe5ed61d9游戏及娱乐 。个性化、娱乐内容的生产。
d47e62d2b349aca45e42305ed6714efbe5ed61d9智能制造 。中国是制造大国,如果叠加智能制造,可以大幅度提高中国制造的水平和能力。中国在软件方面发展较快,但硬件上的话,无论是芯片还是其他重要零部件制造,跟国际水平差距还很大。要承认差距的客观存在性,依靠中国巨大的市场,大力加大研发投入。不能仅靠国家,整个产业的企业和国家要一起把这部分发展起来。
d47e62d2b349aca45e42305ed6714efbe5ed61d9智能农业 。中国是农业大国,在智能农业上已经有一些发展。比如用无人机进行病虫害巡检、定向农药喷洒、大棚的温控,病虫害检测等,未来都有一些非常实际的应用场景。

整体来看,AI在各个行业都有很多落地的场景,未来AI自身的发展结合落地的场景,应该会产生很多创新。

杨强:一个AI,两种模式

fc51355c622f9baa1849bb8b38787264964fbbac

杨强:今天的题目很应景,叫 “落地的人工智能”。这个题目是拿来跟大家探讨的,因为这是一个大题目。人工智能到现在已经 60 多年,几起几落,它的兴衰也是围绕着 “AI是不是可以落地” 进行的。

今天的讲座,第一部分是人工智能概述。

人工智能分为四个发展阶段。初级阶段是感知环境(Perception),我们知道单层的神经网络也叫 perceptron(感知器),是 60 年代就出现的可以简单学习的神经网络。这是 AI 必要的一步,因为要有感知智能,才能收集大量数据,这一阶段需要传感器、互联网、物联网等技术。

第二个阶段是机器学习(machine learning)阶段。能从数据里面学习。第三个阶段是自动推理(reasoning),需要搜索、逻辑、博弈论等技术。最后也是最高阶段是抽象迁移(abstraction),需要有新的理论和系统。

de69a9bafced41d9896b5387fef35d83697418a5

一个AI,两种模式

  • 通用 vs 特殊:有很多人试图解决通用 AI,但现在绝大部分工作还是在特殊的、任务驱动的人工智能。

  • 辅助 vs 自动:比如计算机视觉是辅助型的,相当于给机器戴上了眼镜。无人车是自动型的,因为它的整个运作是自动的,也有自动的学习能力,人类只是为它提供一些必要的资源。

  • 交互 vs 核心:交互型的 AI 是为了跟人沟通,是闭环的。还有一种做法是把 AI 作为一个核心的系统,它的副产品是对人有用,但它可以完全按照自己的方式发展。AlphaGo 就是一个例子。

说到人工智能落地,第一个问题就是什么叫“落地”,谁来规范什么时候AI可以算作“落地了”? 这个标准是首先要建立的。在任何科学与工程领域,都要首先建立测试“成功”的准则,否则就会事倍功半。要知道,智能的测试是非常难以做到公正的,也经历了很多的考验,比如著名的“聪明的汉斯”,是对一匹叫做“汉斯”的马的智能测试,因为一开始没有注意到高维的特征空间,而得到了错误的结论。图灵测试是一种更合理的测试,但也不是唯一的测试。

我认为深度学习的成功主要来自两个方面:第一,层次之间的演化是一种非线性的转化,这种转化如果进行多次,就有可能产生高维空间的 pattern。第二,所有这些加起来,这个网络本身成为一个特征产生器,产生一个高维的空间,在这个空间里,世界上的任何东西(图像、语音等)都会有统一的表达,并且你可以计算它们的距离。

高维度的、统一的特征表达,这就是人工智能想达到的目标。所有的推理、类比、抽象等,都可以在这个空间里得到。但这个空间是通过在数据中学习获得的,这个手段在现阶段是通过大数据,但大数据不是唯一的手段。

AI为什么要有不断创新的能力?

AI 领域每年有上千甚至上万的 paper,是不是说我们就可以躺在 open source 上面,不用创新了?不是的,我们很有必要不断地创新。

一个例子是 GAN,它的一个作用是可以 “鱼目混珠”,生成器可以创造出一些虚假的图片。在金融界就发现有这样的人,他们对深度学习了如指掌,并且可以用AI深度学习的这些手段去欺诈金融的安全系统,因此我们必须要有不断提高的反击的能力。

第二,有些新的学科,比如迁移学习,非常依赖对数据的模拟。GAN 在这个方向是非常有用的工具。

99d68da8bd889bb44decc5df1baf6f37478cd7c4

创新的能力也可以体现在跨界的AI应用上。一个例子是斯坦福大学的一个工作,他们的任务是帮助联合国通过卫星图像,让机器自动地给非洲大陆打标签,这些标签指代地区的“贫困程度。” 但是我们看到一个卫星图像,由于标签的缺乏,我们对图像上对应的贫困程度是一无所知的。传统的做法是派人到本地做经济调查,然后把数据收集起来。这样的做法既危险,又耗时,不准确,数据也非常少。

有没有办法自动地做这件事呢?他们想到了迁移学习,而且是多步的迁移学习。第一步是拿 ImageNet 这种图像来学一个切割模型,第二步是比对白天和晚上的卫星图像,以此获得一个初步的经济模型。因为一般认为晚上比较亮的地方是经济发展比较好的区域。由此得出一些 feature 对应经济发达或不发达的地区。最后的结果,用 survey 的方法的准确率是 75%,用迁移学习的方法准确率是 71%。虽然没有人工的那么好,但是非常省力。

我们现在已经有了不少“迁移学习”在产业应用中的实例。如果已经有了大数据产生的模型,那么在一个新的领域,可以用小数据把大模型迁移过来找到这个领域的要点就是找出两个领域的不变量。我们假设一个领域可以用上亿维的特征来描述,那么我们要找两个领域的特征空间共有的部分来做迁移。

AI落地

网约车识别

这里的一个例子是上海汽车的网约车识别

这个问题是:给定车辆的行驶轨迹,如何判断车辆是否网约车?

我们的策略是引入外部数据来进行迁移学习。外部数据有出租车、公交车的行车轨迹。分两步:首先我们有两个空间,左边是出租车的空间,右边是网约车的空间,我们的目的是把知识从左边搬到右边。但是很明显两边的知识是有差异的,要把这些差异剔除,我们用了半监督学习 + 迁移学习。

b9014f5ed0f0632c0121c38ac993f7da5099c5f5

这个例子告诉我们,AI 的落地首先要目标清晰,清晰到可以把优化函数用数学公式写下来。

第二,需要去找到合适的数据

第三,人才需要领域知识,同时也需要 AI 知识,这种跨界的人才才是 AI 真正需要的人才,否则谈不上落地。

然后,我们也来举一个反例。我们都知道,AI的头几个里程碑都是IBM创造的。但是在AI落地的过程中,IBM也遇到了难题。一个例子就是IBM WATSON在医疗领域的落地。

我们先来看一下IBM WATSON的流程。 首先,当一个问题到来的时候,系统把输入的问题和知识库里的问题加以对比,再按照匹配的概率排序。 如果有匹配度高的问题,那就可以把对应的答案作为输出。 在这个流程中,需要知识库的建立,和问题集的收集。当然,这个流程中又很多依靠机器学习的阶段,比如问题的特征抽取,特征空间的建立,匹配的相似度学习,等。但整个流程的建立还是要依靠专家来进行的。比如,知识库的建立,知识的扩展,以及问答系统在整个医疗系统中的定位等。恰恰因为这些需要人工的地方成为瓶颈,以至于最终用户的定位错误,导致系统并没有完成既定的任务。最后,IBM只能从美国一个很大的医疗机构撤离,也导致了媒体大量的负面报道。

总结起来,这个例子说明,仅仅在一个游戏领域成功(问答的电视大赛),并不表示在开放的实际场景(医疗)就可以取得成功。 首先,IBM Watson的目标客户群是医生,还是病人? 系统的角色是助手还是替代? 有没有既懂医疗又懂AI的专家在团队中? 系统有没有做到前端和知识库的维护的闭环?这些有关落地的问题,都有待回答。

总结:

第一,人工智能是走了很长的路,但是除了深度学习以外,还有很多的领域有待发掘。所以千万不要以为深度学习就是人工智能

第二,人工智能在企业的落地是一门大学问,而且是一门艺术性的学问,因为还没有到科学的程度。所以一个问题是,AI 是产品,还是技术,还是解决方案?第二个问题是,AI 如果在一个领域落地成功,需要哪些基本条件?

最后,我觉得非常有趣的一个点,是 AI 出现了以后、会出现一个新的、以机器智能为主体的产业和社会。那么这个新的商业社会也可能会部分地颠覆我们已有的商学院的知识。现有的商学院的知识主要是针对人的管理和人的决策。那么 AI 对应的是机器的管理和机器的决策,这个学问现在还是空白。


原文发布时间为:2018-06-5

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:【清华 AI 公开课】IJCAI理事长杨强:人工智能在企业的落地是一门大学问

相关文章
|
8天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
140 97
|
18天前
|
机器学习/深度学习 人工智能 安全
CCF-CV企业交流会:打造大模型时代的可信AI,探索AI安全治理新路径
近日,由中国计算机学会计算机视觉专委会主办的《打造大模型时代的可信AI》论坛顺利举行。论坛邀请了来自上海交通大学、中国科学技术大学等机构的专家,从立法、监管、前沿研究等多角度探讨AI安全治理。合合信息等企业展示了图像篡改检测等技术,助力AI向善发展。
59 11
CCF-CV企业交流会:打造大模型时代的可信AI,探索AI安全治理新路径
|
17天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
117 2
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
2天前
|
人工智能 运维 监控
云卓越架构:企业稳定性架构体系和AI业务场景探秘
本次分享由阿里云智能集团公共云技术服务部上海零售技术服务高级经理路志华主讲,主题为“云卓越架构:企业稳定性架构体系和AI业务场景探秘”。内容涵盖四个部分:1) 稳定性架构设计,强调高可用、可扩展性、安全性和可维护性;2) 稳定性保障体系和应急体系的建立,确保快速响应和恢复;3) 重大活动时的稳定重宝策略,如大促或新业务上线;4) AI在企业中的应用场景,包括智能编码、知识库问答、创意广告生成等。通过这些内容,帮助企业在云计算环境中构建更加稳定和高效的架构,并探索AI技术带来的创新机会。
|
5天前
|
存储 人工智能 物联网
工业公辅车间数智化节能头部企业,蘑菇物联选择 TDengine 升级 AI 云智控
在工业节能和智能化转型的浪潮中,蘑菇物联凭借其自研的灵知 AI 大模型走在行业前沿,为高能耗设备和公辅能源车间提供先进的 AI 解决方案。此次采访聚焦于蘑菇物联与 TDengine 的合作项目,通过 AI 云智控平台的建设,双方携手推动制造工厂的能源数智化管理,助力企业实现节能降碳。在本文中,我们将深入探讨蘑菇物联选择 TDengine 的原因、项目实施中的挑战与解决方案,以及合作视角下双方的未来愿景。
14 2
|
16天前
|
人工智能 Serverless API
尽享红利,Serverless构建企业AI应用方案与实践
本次课程由阿里云云原生架构师计缘分享,主题为“尽享红利,Serverless构建企业AI应用方案与实践”。课程分为四个部分:1) Serverless技术价值,介绍其发展趋势及优势;2) Serverless函数计算与AI的结合,探讨两者融合的应用场景;3) Serverless函数计算AIGC应用方案,展示具体的技术实现和客户案例;4) 业务初期如何降低使用门槛,提供新用户权益和免费资源。通过这些内容,帮助企业和开发者快速构建高效、低成本的AI应用。
60 12
|
10天前
|
人工智能 安全 搜索推荐
到2028年,30%的财富500强企业将使用仅支持AI的服务渠道
到2028年,30%的财富500强企业将使用仅支持AI的服务渠道
|
20天前
|
人工智能 自然语言处理 数据挖掘
从行业痛点到AI前沿:揭秘AGI时代企业培训的终极之选
近几年接触到的各类培训合作方越来越多,从国际咨询巨头、互联网科技培训平台,到本土独角兽型的专业培训公司;从专攻新技术与创新场景的培训团队,到深谙传统行业痛点的咨询顾问。作为一名在央企、国企、上市公司人力资源培训条线深耕多年的HR负责人,深知在这片竞争激烈的培训服务蓝海中,寻找高质、高效的合作伙伴并不简单,因为企业培训的逻辑正在悄然改变。
|
27天前
|
人工智能 自然语言处理 算法
AI时代的企业内训全景图:从案例到实战
作为一名扎根在HR培训领域多年的“老兵”,我越来越清晰地感受到,企业内训的本质其实是为企业持续“造血”。无论是基础岗的新人培训、技能岗的操作规范培训,还是面向技术中坚力量的高阶技术研讨,抑或是管理层的战略思维提升课,内训的价值都是在帮助企业内部提升能力水平,进而提高组织生产力,减少对外部资源的依赖。更为重要的是,在当前AI、大模型、Embodied Intelligence等新兴技术快速迭代的背景下,企业必须不断为人才升级赋能,才能在市场竞争中保持领先。
|
2月前
|
机器学习/深度学习 人工智能 Python
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器
MuCodec是由清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学联合开发的超低比特率音乐编解码器。它能够在0.35kbps至1.35kbps的比特率下实现高效的音乐压缩和高保真重建,适用于在线音乐流媒体服务、音乐下载、语言模型建设等多个应用场景。
41 1
MuCodec:清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器