Facebook这样看“深度学习”技术

简介: 本周早些时候,社交网络巨头 Facebook 宣布聘请纽约大学教授扬•乐康(Yann LeCun)掌管其新建的人工智能实验室,他将利用自己擅长的“深度学习”技术帮助Facebook更好地“读懂”用户行为。

本周早些时候,社交网络巨头 Facebook 宣布聘请纽约大学教授扬•乐康(Yann LeCun)掌管其新建的人工智能实验室,他将利用自己擅长的“深度学习”技术帮助Facebook更好地“读懂”用户行为。这位法国裔科学家日前接受了《连线》(Wired)杂志的独家专访,畅谈了深度学习技术和人工智能的未来发展(原文来自 Wired,搜狐 IT 编译)。

 

借助深度学习技术,Facebook可以自动识别用户上传的照片中人物的身份、自动添加相应的人名标签,以及让用户快速与亲朋好友分享照片。此类技术还能分析用户在Facebook上的一举一动,从而自动为用户显示他们想要看到的内容。Facebook可以利用深度学习实现“无穷无尽”的可能性——“它每天都能搜集到人与人之间的关系、搜集到用户在一天里的所作所为,它知道你支持什么党派、买了什么产品。”

 

Wired:我们知道你将会加入Facebook新建的人工智能实验室,但是你和你的人工智能团队具体将会研究什么呢?

乐康:我们想做两件事情——其一,是真正从科学角度和技术层面取得进展,这将包括参与学术界活动和发表论文;其二,从根本上讲,是把一些技术变成能应用到Facebook中的东西。但是我们目标是相当长远的,比Facebook现有的工作更加长远,在某种程度上脱离了日常生产活动,这样人们就有思考未来的余地。

Wired:那种技术会是什么样子?它能做些什么呢?

乐康:我们将要研究的技术,其实就是一切能让机器更加智能化的东西。说得更具体一些,就是基于机器学习的那些东西。如今,打造智能化机器的唯一途径,就是让它们消化大量数据并建立数据模型。近年来兴起了一种叫做“深度学习”的方法。它在图像识别、语音识别等领域得到了极其成功的应用,在自然语言处理领域也小有成就。哪怕我们只研究这些东西,也能对Facebook产生巨大影响——Facebook的用户每天都会上传数以亿计的图片和短视频,而聊天与消息中也蕴藏着海量信号。Facebook目前已经在网站上应用了大量机器学习技术,达到了能向用户显示相关新闻和相关广告的水平。

Wired:这种技术的核心科学其实已经颇有年头了,不是吗?早在20世纪80年代中叶,你和如今在 Google 工作的杰夫•辛顿(Geoff Hinton)等人就率先开发了这些被称为“反向传播”(Back-Propogation)算法的深度学习方法。

乐康:这的确是技术根源,但是我们已经有了更大进展。反向传播能让我们进行“监督运行”——比如,你手头有一组配有标签的照片,你就可以训练系统比对新的照片和标签。Google 和百度目前就是用这样的方法给照片加标签的。

我们都知道上述技术很有效,但是如果你手头的东西是视频或自然语言——它们的标签数据非常少,我们不能只是放一段视频然后让机器告诉我们视频里的内容是什么。我们没有足够的标签数据,而且即便花费大量时间让用户提供标签,能否达到图片标签那样的效果也是个未知数。

Wired:你提到了Google、百度、微软和IBM等其他互联网公司也在研究深度学习。在外行看来,似乎这一领域的所有工作都兴起于一个相对很小的深度学习学术圈,包括你和 Google 的杰夫•辛顿等人。

乐康:你说得一点儿也没错——虽然深度学习发展得很快,但是你得知道这项技术其实可以说是我、杰夫•辛顿以及蒙特利尔大学的约书亚•本吉奥(Yoshua Bengio)三个人的“密谋”——希望你能原谅我这么说。10年前,我们聚在一起,觉得我们应该着手解决视觉和语音方面的机器学习问题。一开始,这项技术是为了机器人控制等目的而开发的,但是我们后来得到了加拿大高级研究所(CIFAR)的资助。杰夫是主管,我是顾问委员会主席,我们每年碰头两次讨论一下进展。当时机器学习和计算机学术圈的大多数人都对这个“密谋”不怎么感兴趣。所以,在很多年里,这项技术一直局限在我们的那些讨论会中。但是,我们开始发表论文之后,越来越多的人开始对我们的研究感兴趣。然后人们开始看到切实的成效,于是产业界开始对此产生浓厚的兴趣。

Wired:在你看来,深度学习与普通的机器学习有何不同?很多人都对Google使用了十几年的那种机器学习算法耳熟能详——那种算法能分析海量数据,从而实现自动识别网络垃圾信息等功能。

乐康:那是一种相对简单的机器学习。创造这种机器学习系统需要付出巨大的努力,因为这种系统其实无法处理原始数据。所以,数据必须被转化为系统能够“消化”的形式。这个过程被叫做“特征抽象”。

以图片为例,你不能把原始像素数据扔给那种传统的机器学习系统,而是必须把数据转化为一种能被分类器消化的形式——以恰当的方式表述图片,正是很多计算机视觉学者在过去二三十年里努力做的事情。

相比之下,深度学习能让机器学习这一表述过程,从而不必由人工解决系统遇到的每一个新问题。如果我们拥有海量数据和强大的计算机,我们就可以建立能学会如何恰当表述数据的系统。

当今的人工智能技术存在的很多局限性,都是因为缺乏好的信号表述方式,或是因为我们现有的表述方式需要付出巨大努力去构建而造成的。深度学习能让我们把这一过程变得更加自动化,也能收到更好的效果。


原文发布时间为:2013-12-15


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
1月前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶汽车中的应用####
【10月更文挑战第21天】 本文探讨了深度学习中的卷积神经网络(CNN)如何革新自动驾驶车辆的视觉感知能力,特别是在复杂多变的道路环境中实现高效准确的物体检测与分类。通过分析CNN架构设计、数据增强策略及实时处理优化等关键技术点,揭示了该技术在提升自动驾驶系统环境理解能力方面的潜力与挑战。 ####
77 0
|
20天前
|
机器学习/深度学习 传感器 边缘计算
基于深度学习的图像识别技术在自动驾驶中的应用####
随着人工智能技术的飞速发展,深度学习已成为推动自动驾驶技术突破的关键力量之一。本文深入探讨了深度学习算法,特别是卷积神经网络(CNN)在图像识别领域的创新应用,以及这些技术如何被集成到自动驾驶汽车的视觉系统中,实现对复杂道路环境的实时感知与理解,从而提升驾驶的安全性和效率。通过分析当前技术的最前沿进展、面临的挑战及未来趋势,本文旨在为读者提供一个全面而深入的视角,理解深度学习如何塑造自动驾驶的未来。 ####
75 1
|
29天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的图像识别技术及其应用
在这篇文章中,我们将探讨深度学习在图像识别领域的应用。通过简单易懂的语言和实际代码示例,我们将深入了解如何利用深度学习技术进行图像识别,并探讨其在不同领域的应用。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的信息。让我们一起探索深度学习的世界吧!
|
26天前
|
机器学习/深度学习 数据采集 传感器
基于深度学习的图像识别技术在自动驾驶中的应用研究####
本文旨在探讨深度学习技术,特别是卷积神经网络(CNN)在自动驾驶车辆图像识别领域的应用与进展。通过分析当前自动驾驶技术面临的挑战,详细介绍了深度学习模型如何提升环境感知能力,重点阐述了数据预处理、网络架构设计、训练策略及优化方法,并展望了未来发展趋势。 ####
85 6
|
24天前
|
机器学习/深度学习 算法框架/工具 网络架构
深度学习中的正则化技术及其对模型性能的影响
本文深入探讨了深度学习领域中正则化技术的重要性,通过分析L1、L2以及Dropout等常见正则化方法,揭示了它们如何帮助防止过拟合,提升模型的泛化能力。文章还讨论了正则化在不同类型的神经网络中的应用,并指出了选择合适正则化策略的关键因素。通过实例和代码片段,本文旨在为读者提供关于如何在实际问题中有效应用正则化技术的深刻见解。
|
2天前
|
数据采集 安全 API
高级技术文章:使用 Kotlin 和 Unirest 构建高效的 Facebook 图像爬虫
高级技术文章:使用 Kotlin 和 Unirest 构建高效的 Facebook 图像爬虫
|
27天前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解人工智能中的深度学习技术及其最新进展
深入理解人工智能中的深度学习技术及其最新进展
|
27天前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解人工智能中的深度学习技术及其最新进展
深入理解人工智能中的深度学习技术及其最新进展
|
27天前
|
机器学习/深度学习 监控 自动驾驶
基于深度学习的图像识别技术研究进展###
本文旨在探讨深度学习在图像识别领域的最新研究进展,重点分析卷积神经网络(CNN)的技术创新、优化策略及其在实际应用中的成效。通过综述当前主流算法结构、损失函数设计及数据集增强技巧,本文揭示了提升模型性能的关键因素,并展望了未来发展趋势。尽管未直接涉及传统摘要中的研究背景、方法、结果与结论等要素,但通过对关键技术点的深度剖析,为读者提供了对领域现状与前沿动态的全面理解。 ###
|
1月前
|
机器学习/深度学习 自然语言处理 网络架构
深度学习中的正则化技术:从理论到实践
在深度学习的海洋中,正则化技术如同灯塔指引着模型训练的方向。本文将深入探讨正则化的核心概念、常见类型及其在防止过拟合中的应用。通过实例分析,我们将展示如何在实践中运用这些技术以提升模型的泛化能力。