帝国的灵魂:谷歌大脑-阿里云开发者社区

开发者社区> 大数据文摘> 正文
登录阅读全文

帝国的灵魂:谷歌大脑

简介:

0


曾在谷歌大脑实习的视觉搜索创业公司Clarifai CEO马修·塞勒称:“谷歌的一切都由机器学习驱动。”国外媒体近日撰文揭秘重塑谷歌帝国的人造大脑。文章指出,3年前创建的谷歌大脑项目表现越来越抢眼,其人工智能系统给谷歌旗下的各个重要产品都带来了助力,从Android语音识别软件到无人驾驶汽车,再到广告和谷歌地图。


以下是文章主要内容:

它是最单调乏味的互联网工作之一。一谷歌团队需要日复一日盯着电脑屏幕,检查街景照片的小细节,反复不断地问自己同一个问题:“我看到的是不是地址呢?”然后点击“是”,点击“是”,点击“否”。


这是打造该公司的谷歌地图服务过程的重要组成部分。知道建筑的准确地址,对于制图师来说确实很有帮助。但那并不能让那些苦逼的谷歌工作人员的生活好过一些,他们必须得一个个地去判断谷歌街景车拍摄的一串数字是电话号码、涂鸦标签还是正确的地址。


而在几个月前,他们终于脱离苦海了,部分谷歌工程师将公司的机器训练得能够处理该类吃力不讨好的任务了。从以往来看,计算机并不擅长处理这类先进的图像识别工作,而谷歌则终于凭借其名为“谷歌大脑”(Google Brain)的新人工智能系统攻克了该问题。利用谷歌大脑,谷歌如今能够在不到一个小时内转录街景车拍到的所有地址信息。


自3年前诞生于谷歌的秘密实验室Google X以来,谷歌大脑在公司内部变得越来越抢眼,让软件工程师们能够将前沿的机器学习算法应用于越来越多的问题解决上。在许多方面,它很可能会给谷歌带来竞争优势,帮助它在未来十年扩张至各个新领域,一如过去十年它的搜索算法和数据中心技术帮助它建立起极为成功的广告业务那样。


机器学习公司

“谷歌不完全是家搜索公司,它是家机器学习公司。”曾在谷歌大脑实习的视觉搜索创业公司Clarifai CEO马修·塞勒(Matthew Zeiler)如是说。他称,谷歌最重要的项目全都受益于该类研究,从无人驾驶汽车,到广告,再到谷歌地图。“该公司的一切都由机器学习驱动。”


除了谷歌地图外,谷歌大脑还给Android的语音识别软件和Google+的图像搜索带来了助力。但据谷歌大脑项目领导者之一杰夫·迪恩(Jeff Dean)称,那还只是个开始。他相信,谷歌大脑将有助提升公司的搜索算法和谷歌翻译。“谷歌内部现在大概有三四十个团队使用我们的基础设施,”迪恩说道,“有的团队应用于生产,有的在进行探索,将谷歌大脑与已有系统进行对比,它们在运用谷歌大脑解决各类问题上普遍都取得很不错的效果。”


该项目是名为“深度学习”的新型人工智能大趋势的一部分。Facebook在探究类似的工作,微软、IBM等公司亦然。不过,谷歌似乎暂时处于领先,对该技术的研究更深入。


人工智能即服务

谷歌大脑诞生于2011年。一年后,谷歌将Android的语音识别错误率大幅降低25%。不久后该公司开始不断招兵买马,网罗它能找到的每一位深度学习专家。去年,谷歌招揽了杰夫·辛顿(Geoff Hinton)——全球最顶级的深度学习专家之一。今年1月,该公司又斥资4亿美元拿下一家神秘的深度学习公司DeepMind。


利用深度学习技术,计算机科学家可建立起在某种程度上模拟人脑学习模式的软件模型。然后,他们训练这些模型处理海量的新数据,并相应调整模型,最终将它们应用于各类新任务。例如,为谷歌图像搜索而建的图像识别模型可能也对谷歌地图团队有帮助。文本分析模型可能有助于改进谷歌的搜索引擎,或许在Google+上也能够派上用场。


谷歌开发了一些人工智能模型,并将它们发布到内部网络上。迪恩及其团队也专门开发了后端软件,让谷歌的服务器进行数据挖掘,然后将结果显示在软件控制面板上,向开发者展示人工智能代码的表现和作用。“它看起来就像是核反应堆控制台。”迪恩说。


对于部分项目,如Android语音识别软件,迪恩的团队需要费一番功夫才能让那些学习模型发挥作用。不过,在使用谷歌大脑软件的团队中,约有一半只需要下载源代码,修改配置文件,以及将谷歌大脑指向它们自己的数据。


考虑到深度学习算法可解决问题之广泛,迪恩及其团队开发的代码可以做的还很多。他们还发现,那些模型往往处理的数据越多,就会变得越精准。那可能是谷歌的下一个重大目标:建立基于数十亿而非数百万的数据点的人工智能模型。正如迪恩所说的,“我们正试图推进下一个水平的可扩展性去训练极其巨大且十分精准的模型。”


原文发布时间为:2014-07-18

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
大数据文摘
使用钉钉扫一扫加入圈子
+ 订阅

官方博客
官网链接