Facebook这样看“深度学习”技术

简介: 本周早些时候,社交网络巨头 Facebook 宣布聘请纽约大学教授扬•乐康(Yann LeCun)掌管其新建的人工智能实验室,他将利用自己擅长的“深度学习”技术帮助Facebook更好地“读懂”用户行为。
0.jpg

本周早些时候,社交网络巨头 Facebook 宣布聘请纽约大学教授扬•乐康(Yann LeCun)掌管其新建的人工智能实验室,他将利用自己擅长的“深度学习”技术帮助Facebook更好地“读懂”用户行为。这位法国裔科学家日前接受了《连线》(Wired)杂志的独家专访,畅谈了深度学习技术和人工智能的未来发展(原文来自 Wired,搜狐 IT 编译)。

 

借助深度学习技术,Facebook可以自动识别用户上传的照片中人物的身份、自动添加相应的人名标签,以及让用户快速与亲朋好友分享照片。此类技术还能分析用户在Facebook上的一举一动,从而自动为用户显示他们想要看到的内容。Facebook可以利用深度学习实现“无穷无尽”的可能性——“它每天都能搜集到人与人之间的关系、搜集到用户在一天里的所作所为,它知道你支持什么党派、买了什么产品。”

 

Wired:我们知道你将会加入Facebook新建的人工智能实验室,但是你和你的人工智能团队具体将会研究什么呢?

乐康:我们想做两件事情——其一,是真正从科学角度和技术层面取得进展,这将包括参与学术界活动和发表论文;其二,从根本上讲,是把一些技术变成能应用到Facebook中的东西。但是我们目标是相当长远的,比Facebook现有的工作更加长远,在某种程度上脱离了日常生产活动,这样人们就有思考未来的余地。

Wired:那种技术会是什么样子?它能做些什么呢?

乐康:我们将要研究的技术,其实就是一切能让机器更加智能化的东西。说得更具体一些,就是基于机器学习的那些东西。如今,打造智能化机器的唯一途径,就是让它们消化大量数据并建立数据模型。近年来兴起了一种叫做“深度学习”的方法。它在图像识别、语音识别等领域得到了极其成功的应用,在自然语言处理领域也小有成就。哪怕我们只研究这些东西,也能对Facebook产生巨大影响——Facebook的用户每天都会上传数以亿计的图片和短视频,而聊天与消息中也蕴藏着海量信号。Facebook目前已经在网站上应用了大量机器学习技术,达到了能向用户显示相关新闻和相关广告的水平。

Wired:这种技术的核心科学其实已经颇有年头了,不是吗?早在20世纪80年代中叶,你和如今在 Google 工作的杰夫•辛顿(Geoff Hinton)等人就率先开发了这些被称为“反向传播”(Back-Propogation)算法的深度学习方法。

乐康:这的确是技术根源,但是我们已经有了更大进展。反向传播能让我们进行“监督运行”——比如,你手头有一组配有标签的照片,你就可以训练系统比对新的照片和标签。Google 和百度目前就是用这样的方法给照片加标签的。

我们都知道上述技术很有效,但是如果你手头的东西是视频或自然语言——它们的标签数据非常少,我们不能只是放一段视频然后让机器告诉我们视频里的内容是什么。我们没有足够的标签数据,而且即便花费大量时间让用户提供标签,能否达到图片标签那样的效果也是个未知数。

Wired:你提到了Google、百度、微软和IBM等其他互联网公司也在研究深度学习。在外行看来,似乎这一领域的所有工作都兴起于一个相对很小的深度学习学术圈,包括你和 Google 的杰夫•辛顿等人。

乐康:你说得一点儿也没错——虽然深度学习发展得很快,但是你得知道这项技术其实可以说是我、杰夫•辛顿以及蒙特利尔大学的约书亚•本吉奥(Yoshua Bengio)三个人的“密谋”——希望你能原谅我这么说。10年前,我们聚在一起,觉得我们应该着手解决视觉和语音方面的机器学习问题。一开始,这项技术是为了机器人控制等目的而开发的,但是我们后来得到了加拿大高级研究所(CIFAR)的资助。杰夫是主管,我是顾问委员会主席,我们每年碰头两次讨论一下进展。当时机器学习和计算机学术圈的大多数人都对这个“密谋”不怎么感兴趣。所以,在很多年里,这项技术一直局限在我们的那些讨论会中。但是,我们开始发表论文之后,越来越多的人开始对我们的研究感兴趣。然后人们开始看到切实的成效,于是产业界开始对此产生浓厚的兴趣。

Wired:在你看来,深度学习与普通的机器学习有何不同?很多人都对Google使用了十几年的那种机器学习算法耳熟能详——那种算法能分析海量数据,从而实现自动识别网络垃圾信息等功能。

乐康:那是一种相对简单的机器学习。创造这种机器学习系统需要付出巨大的努力,因为这种系统其实无法处理原始数据。所以,数据必须被转化为系统能够“消化”的形式。这个过程被叫做“特征抽象”。

以图片为例,你不能把原始像素数据扔给那种传统的机器学习系统,而是必须把数据转化为一种能被分类器消化的形式——以恰当的方式表述图片,正是很多计算机视觉学者在过去二三十年里努力做的事情。

相比之下,深度学习能让机器学习这一表述过程,从而不必由人工解决系统遇到的每一个新问题。如果我们拥有海量数据和强大的计算机,我们就可以建立能学会如何恰当表述数据的系统。

当今的人工智能技术存在的很多局限性,都是因为缺乏好的信号表述方式,或是因为我们现有的表述方式需要付出巨大努力去构建而造成的。深度学习能让我们把这一过程变得更加自动化,也能收到更好的效果。


原文发布时间为:2013-12-15


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
9天前
|
机器学习/深度学习 人工智能
深度学习中的正则化技术及其应用
【9月更文挑战第8天】在深度学习的探索之旅中,正则化技术如同指南针,引导我们穿越过拟合的迷雾。本文将深入浅出地介绍几种常见的正则化方法,并通过实际代码示例揭示它们如何在模型训练中发挥作用。从L1和L2正则化的基本概念出发,到Dropout技术的随机性之美,再到数据增强的多样性魅力,我们将一起见证这些技术如何提升模型的泛化能力。你将发现,正则化不仅是防止过拟合的技术手段,更是深度学习艺术的一部分。让我们开始这段探索之旅,解锁深度学习中正则化的奥秘。
30 10
|
14天前
|
机器学习/深度学习 算法 TensorFlow
深度学习中的图像识别技术
【9月更文挑战第3天】本文介绍了深度学习在图像识别领域的应用,包括卷积神经网络(CNN)的原理、实现和优化方法。通过代码示例展示了如何使用Python和TensorFlow库构建一个简单的CNN模型进行图像分类。
|
1天前
|
机器学习/深度学习 监控 自动驾驶
基于深度学习的图像识别技术及其应用
【9月更文挑战第16天】本文深入探讨了基于深度学习的图像识别技术,并详细阐述了其在不同领域的应用。通过分析深度学习在图像识别中的作用机制和关键技术,本文揭示了该技术在自动驾驶、医疗诊断、安防监控等领域的应用前景。同时,文章还讨论了当前面临的挑战和未来的发展方向,为读者提供了对深度学习图像识别技术的全面认识。
|
3天前
|
机器学习/深度学习 存储 自然语言处理
深度学习中的模型压缩技术:从理论到实践
本文深入探讨了深度学习领域中的模型压缩技术,包括权重剪枝、量化、知识蒸馏和轻量级模型设计。通过对比实验结果,展示了这些技术在保持模型精度的同时,显著降低计算资源和存储需求。
|
5天前
|
机器学习/深度学习 编解码 文件存储
深度学习中的模型压缩技术:从理论到实践
本文旨在探讨深度学习领域中的模型压缩技术,包括其背后的理论基础、常见方法以及在实际场景中的应用。我们将从基本的量化和剪枝技术开始,逐步深入到更高级的知识蒸馏和模型架构搜索。通过具体案例分析,本文将展示这些技术如何有效减少模型的大小与计算量,同时保持甚至提升模型的性能。最后,我们将讨论模型压缩技术未来的发展方向及其潜在影响。
|
5天前
|
机器学习/深度学习 自然语言处理 算法
深度学习中的模型压缩技术:从理论到实践
随着深度学习技术的迅速发展,复杂的神经网络模型在许多任务中取得了显著成果。然而,这些模型通常参数量大,计算复杂度高,难以部署到资源受限的设备上。为了解决这个问题,模型压缩技术应运而生。本文将探讨几种主流的模型压缩方法,包括权重剪枝、量化和知识蒸馏,介绍其基本原理、实现步骤以及在实际应用中的效果。通过具体案例分析,我们将展示如何有效地使用这些技术来减少模型的大小和计算需求,同时保持甚至提升模型的性能。最后,我们将讨论当前模型压缩技术面临的挑战和未来的发展方向。
|
5天前
|
机器学习/深度学习 算法框架/工具 Python
深度学习中的正则化技术及其应用
【9月更文挑战第12天】在深度学习领域,正则化技术是防止模型过拟合的重要手段。本文将深入探讨L1、L2以及Dropout等常见的正则化方法,并结合代码示例,展示如何在实际应用中有效利用这些技术提升模型的泛化能力。
12 1
|
16天前
|
机器学习/深度学习
深度学习中的正则化技术:防止过拟合的利器
在深度学习的探索之旅中,模型的性能往往受限于一个隐形的敌人——过拟合。本文通过深入浅出的方式,探讨了如何运用正则化技术这一护盾,保护我们的模型免受过拟合之害。从L1和L2正则化的基本概念出发,到深入理解Dropout和数据增强等高级技巧,我们将一起构建起防御过拟合的坚固堡垒。
|
15天前
|
机器学习/深度学习 监控 自动驾驶
深度学习中的图像识别技术
【9月更文挑战第2天】本文将介绍深度学习在图像识别领域的应用。我们将探讨如何通过深度学习模型,特别是卷积神经网络(CNN)来识别图像中的对象。我们将看到,通过训练一个深度学习模型,我们可以实现对图像中对象的自动识别,这对于许多实际应用来说都是非常有用的。
|
18天前
|
机器学习/深度学习 传感器 人工智能
基于深度学习的图像识别技术在自动驾驶系统中的应用
【8月更文挑战第30天】 随着人工智能的快速发展,特别是深度学习技术在图像处理和模式识别领域的突破进展,自动驾驶系统得以实现更为精准的环境感知与决策。本文深入探讨了基于深度学习的图像识别技术在自动驾驶系统中的应用,并分析了其对提高自动驾驶安全性和可靠性的重要性。通过综合运用卷积神经网络(CNN)、递归神经网络(RNN)等先进算法,我们能够使自动驾驶车辆更好地理解周围环境,从而进行有效的导航与避障。文章还指出了目前该领域面临的主要挑战及未来的发展方向。