香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

简介:

雷锋网(公众号:雷锋网)按:腾讯暨 KDD China 大数据峰会在深圳举行,其中香港科技大学教授、第四范式首席科学家杨强做了一期以《从深度学习到迁移学习》为主题的演讲,本文主要阐述了杨强教授在会中讲解迁移学习在产业界的实际应用,由雷锋网亚峰、亚萌、宗仁联合编辑。

迁移学习是什么?

简单讲,就是能让现有的模型算法稍加调整即可应用于一个新的领域和功能的一项技术。迁移学习能够将适用于大数据的模型迁移到小数据上,实现个性化迁移。

人类很自然就具备举一反三的迁移能力,如我们学会骑自行车后,学骑摩托车就很简单了;会打羽毛球,再学打网球也就没那么难了。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

迁移学习四种实现方法:

1.样本迁移

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

样本迁移即在数据集(源领域)中找到与目标领域相似的数据,把这个数据放大多倍,与目标领域的数据进行匹配。其特点是:需要对不同例子加权;需要用数据进行训练。

2.特征迁移

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

特征迁移是通过观察源领域图像与目标域图像之间的共同特征,然后利用观察所得的共同特征在不同层级的特征间进行自动迁移。

3.模型迁移

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

模型迁移利用上千万的图象训练一个图象识别的系统,当我们遇到一个新的图象领域,就不用再去找几千万个图象来训练了,可以原来的图像识别系统迁移到新的领域,所以在新的领域只用几万张图片同样能够获取相同的效果。模型迁移的一个好处是我们可以区分,就是可以和深度学习结合起来,我们可以区分不同层次可迁移的度,相似度比较高的那些层次他们被迁移的可能性就大一些。

4.关系迁移

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

如社会网络,社交网络之间的迁移。

迁移学习在产业界的实际应用

1.迁移学习在机器阅读中的应用

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

所谓“机器阅读”,就是把自然语言文本转化为机器可以理解的模式,然后机器根据这个模式对个人进行服务。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

这个模式可以从不同的层次进行“理解”,比如可以在字、句子、段落、文档和多文档当中产生各种隐式表达,而这些表达可以用空间的相似度来代替,这样加一个词,可以映射到高维空间。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

有了这种表达之后,可以拿一句话到比如说 LSTM 里 ,对应的就是输出,这个输出就会给我们对话一个现象。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

同时,我们还可以拿 Attention 模型去标明一些问句里面的概念,它可以利用同一个对比相似性找到这个概念。因为其内部隐含的表达是一个 text,把周边字的名称给理解了,它的应用就是可以自动产生文本摘要(Automatic Summarization)。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

这个在 Information Retrieval里面叫做 Summarization,过去的 Summarization 做法是“提取式” (Extractive)的。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

但是今天 Summarization 可以做到“理解”,并用自己的语言或用户喜欢的语言表达出来。所以这里就要提出一个新的方式,就是既可以结合传统 Summarization,并加入用户反馈(比如用户看了某篇文章、所看时长或点赞行为)。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

所以,接下来就可以把模型个性化,给张三看的 Summarization和李四看的 Summarization不一样,就像一篇文章我们需要产生一个吸引眼球的标题,但你给张三和李四看的标题都是不一样的。

2.迁移学习在对话系统中的应用

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

训练一个通用型的对话系统,该系统可能是闲聊型,也可能是一个任务型的。但是,我们可以根据在特定领域的小数据修正它,使得这个对话系统适应不同任务。比如,一个用户想买咖啡,他并不想回答所有繁琐的问题,例如是要大杯小杯,热的冷的?

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

所以我们希望这个系统了解用户的喜好,根据过去的数据分析,一步到位提供一杯符合用户需求的咖啡。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

这里举个例子,买咖啡的时候,可能你不喜欢每次都回答所有问题,比如你要大杯小杯啊?热的冷的啊?而是想这个助手了解我,可以根据我们过去的小数据来一步到位。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

据此,我做了一个推荐系统,把一个在三万个对话基础上做了一个通用型的对话系统,或者说任务型的对话系统,迁移到一个个性化的统计上,变成只有 9 个对话的(小数据)上,就像一个懂你的小秘书。同理,这个也可在金融系统,问一些金融和股票的问题,然后它通过强化学习,给你建议一些 Candidate。并且对收益和用户的需求做排序。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

在这个过程中,我们看到:

第一部分是深度学习效果。

第二部分是强化学习效果。

第三部分是迁移学习效果。

最后我要讲最近一些做的迁移学习的工作。如果两个领域,直接迁移是不行的,我们可以找到一些中间的领域。这个我们可以用深度学习的方法,假设我们用一个大数据,已经训练好的一个系统,然后我们现在的目标是到达一个目标领域,若我们不能一步到位的话,会发现一旦我们用的小数据,各种数据的属性相差很多,怎么办呢?我们去找一些中间的领域,中间的领域可以适度的的改变, 并且一些不应该改变的部分不会改变。这样经过合理改变之后,部分数据加以梳理,最后就得到我们要的被迁移数据。

3.迁移学习在舆情分析中的应用

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

迁移学习也可应用在舆情分析中,如用户评价方面。以电子产品和视频游戏留言为例,上图中绿色为好评标签,而红色为差评标签。我们可以从上图左侧的电子产品评价中找到特征,促使它在这个领域(电子产品评价)建立模型,然后利用模型把其迁移到视频游戏中。这里可以看到,舆情也可以进行大规模的迁移,而且在新的领域不需要标签。

4.迁移学习在推荐系统中的应用


香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用


我们之前也与 IMBD 做过在线推荐系统,在某个领域做好一个推荐系统,然后应用在稀疏的、新的垂直领域。

风头正劲的迁移学习

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

当今全世界都在推动迁移学习,当今 AAAI 中大概有 20 多篇迁移学习相关文章,而往年只有五六篇。与此同时,如吴恩达等深度学习代表人物也开始做迁移学习。

为什么呢?因为要在一个领域找到高质量的数据非常难,而把现成的模型用在高质量数据量少的领域则是非常好的解决方案。

香港科技大学杨强 KDD China 技术峰会演讲:迁移学习的本质与实际应用

最后,我做一个总结,昨天我们在深度学习上有着很高成就。但我们发现深度学习在有即时反馈的领域和应用方向有着一定的优势,但在其他领域则不行。打个比方:就像我在今天讲个笑话,你第二天才能笑得出来,在今天要解决这种反馈的时延问题需要强化学习来做。而在明天,则有更多的地方需要迁移学习:它会让机器学习在这些非常珍贵的大数据和小数据上的能力全部释放出来。做到举一反三,融会贯通。

相关阅读:

腾讯暨 KDD China 大数据峰会之前,杨强教授就曾在 2016 年雷锋网承办的 CCF- GAIR 全球人工智能与机器人峰会大会上,深入浅出地为大家讲述了人工智能要取得成功应当具备的五个必要条件和迁移学习的本质。


本文作者:亚峰


本文转自雷锋网禁止二次转载,原文链接

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
机器学习/深度学习 人工智能
AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛——10:10-10:40鬲融教授《Towards a theoretical understanding of l 》
AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛——10:10-10:40鬲融教授《Towards a theoretical understanding of l 》
AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛——10:10-10:40鬲融教授《Towards a theoretical understanding of l 》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——15:00-15:40刘嘉教授《From Representation to Comp: the Cognitive N》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——15:00-15:40刘嘉教授《From Representation to Comp: the Cognitive N》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——15:00-15:40刘嘉教授《From Representation to Comp: the Cognitive N》
|
机器学习/深度学习 人工智能
AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛——10:40-11:10金驰《Near-Optimal Reinforcement Learning with Sel》
AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛——10:40-11:10金驰《Near-Optimal Reinforcement Learning with Sel》
AI:2020年6月24日北京智源大会演讲分享之机器学习前沿青年科学家专题论坛——10:40-11:10金驰《Near-Optimal Reinforcement Learning with Sel》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——13:40-14:20毕彦超教授《Knowledge representation in the Human brain》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——13:40-14:20毕彦超教授《Knowledge representation in the Human brain》
AI:2020年6月22日北京智源大会演讲分享之认知神经基础专题论坛——13:40-14:20毕彦超教授《Knowledge representation in the Human brain》
AI:2020年6月23日北京智源大会演讲分享之智能信息检索与挖掘专题论坛——09:55-10:40刘欢教授《Challenges in Combating Disinformation》
AI:2020年6月23日北京智源大会演讲分享之智能信息检索与挖掘专题论坛——09:55-10:40刘欢教授《Challenges in Combating Disinformation》
AI:2020年6月23日北京智源大会演讲分享之智能信息检索与挖掘专题论坛——09:55-10:40刘欢教授《Challenges in Combating Disinformation》
|
机器学习/深度学习 人工智能 自然语言处理
54篇论文入选国际顶会AAAI 2021 阿里让AI更懂复杂语言
2月2日,人工智能领域的国际顶会AAAI2021线上举办,记者获悉,阿里巴巴共有54篇论文入选大会,成果抢眼,其中多项研究聚焦NLP(自然语言处理),让AI更懂复杂语言。
204 0
54篇论文入选国际顶会AAAI 2021 阿里让AI更懂复杂语言
|
机器学习/深度学习 人工智能 自然语言处理
IJCAI 2021开幕:程序主席周志华揭晓热门研究主题,杰出论文等奖项出炉
从AI学术顶会IJCAI统计的这些数据中,洞见热门研究趋势。
182 0
IJCAI 2021开幕:程序主席周志华揭晓热门研究主题,杰出论文等奖项出炉
|
机器学习/深度学习 人工智能 自然语言处理
对话清华大学周昊,详解IJCAI杰出论文及其背后的故事
本文中周昊分享了自己NLP研究心得,并对自己的获奖论文进行了解读,希望可以给大家的研究与学习带来灵感。
1636 0
|
机器学习/深度学习 人工智能 自然语言处理
八篇论文引爆ICML,蚂蚁金服技术亮相国际机器学习大会
小蚂蚁说: 国际机器学习大会ICML 2018 于 7 月 10 日在瑞典斯德哥尔摩召开。这场学术大会于1980年首次在匹兹堡举行,今年已是第 35 届,和 NIPS(神经信息处理系统大会)并列为机器学习学术界最顶级的会议。
2377 0