2016这一年,深度学习开始主宰互联网

本文涉及的产品
语种识别,语种识别 100万字符
图片翻译,图片翻译 100张
文本翻译,文本翻译 100万字符
简介:

2016这一年,深度学习开始主宰互联网

雷锋网按:2016 即将画上句号,当我们回顾这一年的科技进展时,雷锋网很难不联想到一个词——深度学习。当它从研究室中脱胎而出,并成为今年的当红热词,实际上我们已经意识到深度学习的来临。从 AlphaGo 到 Google Translate,雷锋网也做过不少覆盖和解析。Cade Metz 为 Wired 撰文回顾了与深度学习同行的这一年,雷锋网(公众号:雷锋网)编译,未经许可不得转载。

在澳大利亚西海岸,Amanda Hodgson 正在操控无人机飞跃海面,无人机可以帮助他们在水面上拍摄照片,利用这些照片,可以定位澳大利亚珀斯湾的儒艮(也就是我们俗称的海牛)——世界上最珍贵的濒临灭绝保护动物之一。虽然照片拍摄的非常成功,但 Hodgson 和她的团队很快就遇到了一个新问题:如果仅靠肉眼甄别,他们没有能力从所有拍摄的约 4.5 万张照片中找到儒艮的身影。所以,她决定把这个工作交给一个深度神经网络来处理。

神经网络是一种机器学习模型,举个例子,Facebook 公司可以在其平台上的 news feed 里识别照片中的人脸。再比如你的安卓手机可以识别出你所问的问题,然后帮你运行谷歌搜索引擎。这些神经网络都是模拟了人类大脑,然后利用数据模型分析大量数据,进行自主学习各种事物。 现在,身为珀斯莫道克大学海洋生物学家的 Hodgson,  也在使用同样的技术在拍摄的数万张开放水域照片中寻找儒艮,这套神经网络是基于谷歌开源机器学习软件 TensorFlow 开发的。

正如 Hodgson 所解释的,检测这些儒艮需要特殊的定点精准度,因为它们通常都是潜伏在海洋表面,而且身体颜色和水面折射的波光很相似,所以分辨起来难度很大。不过,这并没有难倒神经网络系统,它们可以识别出分布在珀斯湾 80% 的儒艮。

目前,这个项目仍处于早期阶段,但已经向人们展示出了深度学习技术在过去一年里的强大影响力。2016 年,深度学习技术帮助“AlphaGo”战胜了世界顶级围棋手李世石,要知道就在几个月之前,还没有人能相信机器可以做到这一点。而打败围棋世界冠军,不过是机器学习领域里的一个“小插曲”而已,如今,机器学习已经不再是“忽悠”人的小把戏,更不是什么黑科技了,随着我们即将迈入 2017 年,像谷歌、Facebook、微软和亚马逊这些科技巨头也开始推广这一技术,这些互联网巨头加大了开源软件和云计算服务的部署,深度学习的实际应用逐渐增多。

全新的机器翻译

在过去的几年里,神经网络颠覆了很多领域,比如 Google Photos 应用让图像识别上升到了一个新高度;而 Google Now 和微软小娜这些数字助手在语音识别上也获得了重大突破。今年,机器学习技术开始应用到翻译领域,该技术可以将一种语言自动翻译成另外一种语言。今年九月,谷歌推出了全新的“谷歌神经机器翻译”服务,完全通过神经网络来运行,这套全新的翻译引擎在翻译特定语言的时候,能够将误差率降低 55-85%。

通过导入大量现有的翻译数据,谷歌开始训练这些神经网络,当然,有些训练数据质量并不高,包括之前版本的谷歌翻译应用所翻译的数据。但是这些数据中也包含人类翻译专家所做的高质量翻译数据。事实上,深度学习技术最让人着迷的地方,就是它可以克服数据质量参差不齐的问题,只要给神经网络足够多的数据,让它去学习,即使里面有各种缺陷,也一样能获得比较好的学习效果。

Mike Schuster 是一名谷歌高级工程师,他坦诚地表示,目前谷歌翻译距离完美还比较遥远,不过应用机器学习的谷歌翻译体现的是一种技术突破,因为谷歌翻译服务现在完全依赖于深度学习,所以未来谷歌想要改善、优化这项服务就会变得更加简单。谷歌可以专注于优化系统整体,而不是像过去那样一个个去优化机器翻译服务里的小模块。

与此同时,微软也在尝试在翻译应用中使用机器学习技术。就在这个月,微软公司发布了新版翻译应用 Microsoft Translator,可以翻译九种不同语言的实时对话。根据微软公司负责人工智能研究的副总裁 Harry Shum 透露,全新的翻译系统同样完全依赖于神经网络,不要小看它,因为这意味着微软的机器翻译能力很可能会在短时间内快速提升,获得重大突破。

全新的对话聊天

在 2016 年,深度学习技术在聊天机器人领域里得到了广泛应用,其中最让人关注的就是谷歌的 Google Allo,这款聊天机器人在今年秋季正式发布,它可以分析用户接收到的文本和照片,然后给予推荐和智能回复。Allo 聊天机器人是基于谷歌前期一项名为“智能回复(Smart Reply)”的技术研发出来的,后者更类似于电子邮件自动回复信息。深度学习在聊天机器人应用的很好,很大一部分原因是因为它尊重了今天机器学习技术的局限性。实际上,Allo 聊天机器人对话的回复通常比较简短,而且它通常也会给出几个建议,这主要是因为目前人工智能技术还无法正确地处理所有事情。

在 Allo 聊天机器人里,神经网络不仅可以利用谷歌搜索引擎回答用户提出的问题,同时它还能够将用户询问的问题反馈给谷歌公司,帮助他们优化答案。在谷歌搜索产品经理 David Orr 看来,如果没有深度学习技术的支持,Allo 聊天机器人本身根本没有回答任何问题的能力。他说道:

你需要使用升级网络——至少这是我们目前找到的唯一解决方案,我们不得不使用所有现在能够掌握的最先进的技术。

不过,神经网络真正无法做到的,其实是将一个实际对话持续下去,从这个角度来看,无论科技大咖们如何吹嘘自己的技术如何先进,聊天机器人依然有很长的路要走。不过,谷歌、Facebook、以及其他科技巨头旗下的研究人员会不断探索深度学习技术,希望能够尽快实现这一愿景。得益于这些研究人员的努力,我们已经看到了语音识别、图像识别、以及机器翻译得到了巨大进步,而聊天机器人会话将会是他们需要攻克的下一个前沿阵地。

全新的数据中心

今年夏天,谷歌人工智能工程师 Demis Hassabis 和 Google DeepMind 实验室团队推出了人工智能“AlphaGo”,并且打败了围棋世界冠军。不过,除了“AlphaGo”之外,他们还构建了一套人工智能应用,可以帮助谷歌高效运营全世界范围内的计算机数据中心网络。这项技术名为强化深度学习,该技术曾应用在早期围棋人工智能和 DeepMind 服务里面。现在,谷歌利用强化深度学习技术管理旗下数据中心运营,比如人工智能可以决定什么时候打开数据中心内数千台计算机服务器的冷却风扇开关、什么时候打开数据中心的窗户强化冷却效果、或是什么之后关闭昂贵的空调制冷等等。据悉,人工智能可以高效管理一个数据中心内 120 多项功能。

人工智能的确高效,谷歌已经节省了数亿美元成本,换句话说,谷歌在 2014 年以 6.5 亿美元的高价收购 DeepMind,现在基本上“回本儿”了。现在,DeepMind 正计划在谷歌所有计算设备上部署传感器,这样就能收集更多数据,帮助训练人工智能达到更高的管理水平。

全新的云计算服务

科技巨头们已经开始在自己的产品和服务中推动机器学习技术的应用,不过他们同样希望在其他领域里施展拳脚。2015 年末,谷歌开源了 TensorFlow。在过去的一年时间里,TensorFlow 软件造福了很多人,其中就包括前文提到的澳大利亚生物学家 Amanda Hodgson。与此同时,谷歌、微软、以及亚马逊等公司也开始在自己的云计算服务中应用深度学习技术,任何程序员或公司都可以开发自己的 App,“人工智能即服务”已然成为了互联网三大巨头最重要的核心业务。

在过去的十二个月,由于人工智能行业发展的日益火爆,这一领域里的人才也变得炙手可热。作为这一领域里的翘楚之一,斯坦福大学教授李飞飞最近被谷歌挖去,负责人工智能云计算业务。亚马逊公司也挖来了卡耐基梅隆大学教授 Alex Smolna,负责旗下人工智能云计算业务。互联网巨头们还是尽可能地笼络全球人工智能技术人才,好消息是,这些人才并没有拘泥于自己的小圈子,他们都愿意将自己的研究成果分享给大家。

随着人工智能技术的不断进化,计算科学家所扮演的角色也在发生转变,未来也许真的不需要人工程序员去编写代码软件了,反而需要更多人才去训练神经网络学习,所以掌握这一技能的人会更具竞争优势。像谷歌和 Facebook 这样的大企业,他们不仅招募了大量新型人才,同时也在积极引导自己的员工拥抱新技术——未来,我们的科技或许真的会由人工智能来定义,而且会影响到每个人的生活。

VIA wired

【兼职召集令!】

如果你对未来充满憧憬,喜欢探索改变世界的科技进展,look no further!

我们需要这样的你:

精通英语,对技术与产品感兴趣,关注人工智能学术动态的萝莉&萌妹子&技术宅;

文字不求妙笔生花,但希望通俗易懂;

在这里,你会收获:

一群来自天南地北、志同道合的小伙伴;

前沿学术科技动态,每天为自己充充电;

更高的生活品质,翻翻文章就能挣到零花钱;

有意向的小伙伴们把个人介绍/简历发至 guoyixin@leiphone.com,如有作品,欢迎一并附上。


本文作者:天诺


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
机器学习/深度学习 人工智能 搜索推荐
|
12天前
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
57 5
|
4天前
|
机器学习/深度学习 网络架构 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过研究卷积神经网络(CNN)的结构和原理,本文展示了深度学习如何提高图像识别的准确性和效率。同时,本文也讨论了数据不平衡、过拟合、计算资源限制等问题,并提出了相应的解决策略。
36 19
|
4天前
|
机器学习/深度学习 传感器 人工智能
探索深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过介绍卷积神经网络(CNN)的基本原理和架构设计,阐述了深度学习如何有效地从图像数据中提取特征,并在多个领域实现突破性进展。同时,文章也指出了训练深度模型时常见的过拟合问题、数据不平衡以及计算资源需求高等挑战,并提出了相应的解决策略。
38 7
|
14天前
|
机器学习/深度学习 自动驾驶 算法
深度学习在图像识别中的应用
本文将探讨深度学习技术在图像识别领域的应用。我们将介绍深度学习的基本原理,以及如何利用这些原理进行图像识别。我们将通过一个简单的代码示例来演示如何使用深度学习模型进行图像分类。最后,我们将讨论深度学习在图像识别领域的未来发展趋势和挑战。
|
14天前
|
机器学习/深度学习 数据采集 算法
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,重点分析了卷积神经网络(CNN)的基本原理、优势以及面临的主要挑战。通过案例研究,展示了深度学习如何提高图像识别的准确性和效率,同时指出了数据质量、模型泛化能力和计算资源等关键因素对性能的影响。
|
14天前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用及其面临的挑战。通过分析深度学习模型如卷积神经网络(CNN)的工作原理,我们揭示了这些模型如何有效地处理和识别图像数据。同时,文章也指出了当前深度学习在图像识别中遇到的一些主要问题,包括过拟合、数据集偏差和模型解释性等,为读者提供了对这一领域全面而深入的理解。