《白话深度学习与TensorFlow》——2.4 深度学习应用

简介: 本节书摘来自华章计算机《白话深度学习与TensorFlow》一书中的第2章,第2.4节,作者:高扬,卫峥著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.4 深度学习应用

我们在第1章所介绍过的谷歌无人驾驶汽车仅仅是深度学习的一个典型应用,深度学习的应用领域越来越多,而且是几乎在任何一个产业中都有其落地的身影。我们先来看几个有趣的应用。
2.4.1 围棋机器人——AlphaGo
击败李世石的谷歌AlphaGo就不用说了,它已经进入我们的视线很久了。
它由谷歌旗下DeepMind公司的戴维·西尔弗(David Silver)、艾佳·黄和戴密斯·哈萨比斯(Demis Hassabis)与他们的团队开发,这个程序利用价值网络(value network)去计算局面,用策略网络(policy network)去选择下子。2015年10月AlphaGo以5∶0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,并以4∶1的总比分获胜。2016年7月18日,世界职业围棋排名网站GoRatings公布最新世界排名,AlphaGo以3612分,超越3608分的柯洁成为新的世界第一。
AlphaGo其实是有两个“大脑”组成的,也就是两套完整的深度学习网络来进行配合计算的。
第一大脑:落子选择器(move picker)。
AlphaGo的第一个神经网络大脑是“监督学习的策略网络”,观察棋盘布局企图找到最佳的下一步。事实上,它所基于的理论仍旧是遍历一棵树。它预测每一个符合规则的下一步的最佳概率,或者说是每一步落子后获胜的概率,然后选择其中一个获胜概率最高的位置落子。这可以理解成落子选择器。
image

第二大脑:棋局评估器(position evaluator)。
AlphaGo的第二个大脑棋局评估器是在做另外一件事情。它可以用来评价一个盘面的好坏程度,所以这种所谓的棋局评估器就是价值网络,通过整体局面判断来辅助落子选择器。这个判断仅仅是个大概的价值评估,但对于盘面的阅读速度提高很有帮助。通过分析潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读,也就是多看几步棋。如果棋局评估器说这个特殊盘面的变种不行,那么AI就跳过阅读在这一条线上的任何更多落子,从而加快盘面阅读的速度。
image

在这个围棋软件的背后可以说是凝聚了大量的深度学习工程师的心血的,不过也可以说是凝聚了全世界所有围棋高手和围棋爱好者的心血。AlphaGo变得这么强悍,不是因为它天生有这么强的功能,而是因为它在不断和世界上所有的围棋高手以及围棋爱好者下棋的过程中不断进行学习和自我完善——它每天可以完成100万盘棋,甚至是让自己的“左手”跟自己的“右手”下棋,并从中总结规律。这是任何人类都无法做到的。
2.4.2 被教坏的少女——Tai.ai
同样是在2016年3月,微软在测试一款新型聊天机器人Tay.ai,不过悲剧的是这款机器人在Twitter上经过用户的不正当“调教”已经变成了“女流氓”,不仅飙脏话,还发表一些带有种族歧视的言论,最后微软不得不将其下线。
据悉,这款聊天机器人主要是定位于18~24岁的美国年轻网友,微软对机器人的交流内容并没有做任何设定,通过和网友进行对话学习,来逐渐形成自己的交流体系。用户只需在Twitter上@TayandYou就能得到Tay.ai的回复。
image

用户对Tay.ai似乎很感兴趣,不过出乎意料的是,在24小时之内,Tay.ai就开始被网友带坏,发布了不少攻击性的言论,让人大跌眼镜,不少网友见证了Tay.ai从腼腆少女到不良少女的转变。有人还画了一种一脸邪念的漫画来把这个“女机器人”的表现具象化。目前微软方面表示正在对这款人工智能机器人Tay.ai进行调整。
从原理分类来说,Tay.ai所基于的技术应该是RNN及其扩展领域,也就是循环神经网络recurrent neural networks,这种技术能够比较容易识别上下文关系并对其进行深度学习。但是同样是那个问题,计算机自己是极难识别“善恶美丑”的,这种对于人的三观会有较清晰划定的东西对于计算机来说确实很难。
一方面人类对抽象事物的理解本身就有优势,对于与自己三观有矛盾的东西本身就有天然的抵触性,但是计算机没有——它没有判断这种是非的能力。
另一方面,计算机学习的速度真的是快得惊人。要不怎么说一切事物都有两面性呢,即使是学坏它也比一般人学坏得快。脏话我们人一分钟学十句,人家一分钟学个十万句估计跟玩一样。所以最后实在没办法,微软只能把它下架了。
不过你也不用想太多,虽说是把机器人教坏了,也只是看上去有点坏,它的内心还是“清白”的,它自己其实根本只是在模仿人类说话,根据上下文找一句看上去“最该说的”话,但它其实并不知道自己在真的说什么。
2.4.3 本田公司的大宝贝——ASIMO
日本本田是一家世界驰名的大公司,我们现在知道更多的是本田的汽车和摩托车,而最令本田引以为豪的其实是它们公司的宝贝ASIMO——阿西莫。有兴趣的话,读者朋友们可以去访问一下本田公司的阿西莫子站点http://www.honda.co.jp/ASIMO/about/
image

应该说阿西莫是目前世界上为数不多的可以以类人型出现的综合场景应用的机器人。阿西莫的身高为130cm,宽45cm,进深34cm,最大行进速度为每小时9km——可别小看,人家是可以双脚离地进行奔跑的9km啊。可以连续行走40min不用充电。
image

它背后的匣子就是电池,比我们平时用的手机电池大多了,不过也没办法,这么复杂的机器人不耗电才奇怪。
它的头部、腕部、手部、腰部、脚部有很多的自由关节,整个肢体合计可以有57个自由度的弯曲维度,感触极为细腻,所以他所能做的事情也是非常令人叹为观止的。
image

它可以打断一个人的谈话,并告知这个人有饮料送过来了。
image

它可以根据人的行走方向做预判,并调整自己的行进方向不要与对方发生碰撞。
image

即便是三个人同时说话它也能听清楚三个人分别讲述的内容并加以复述。
你以为光这样就完了吗?那可太低估人家了。
image

阿西莫还可以用恰当的力道把水杯盖子打开,向纸杯里倒水,你说这得多温柔。
image
image

还有就是类似踢球和上下楼这种对平衡性要求极为苛刻的事情,阿西莫也能轻松胜任。怎么样,是不是确实很厉害?
对于阿西莫的训练来说,深度学习的技术肯定是少不了了。不过除此之外更厉害的恐怕还是本田公司的各种硬件感知器技术、材料工程技术(包括电池、超导等)、自动化技术等综合领域的结合和应用。阿西莫基本代表了当今世界人形机器人制造的最高水平,目前能够做到与这个水平类似的机器人制造团队还是寥寥无几。给笔者印象最深的还是美国的Boston Dynamics公司的Atlas系列机器人,虽然样子没有阿西莫那么萌吧,但是也能够双脚行走,而且在湿滑的地面上走也不会摔倒。被人故意推倒也能站起来,还能够负重走路保持平衡,也是让人眼前一亮。

image

人形机器人的制造是对综合学科的应用的考验,能够进行制造和普及才能够彰显科技大国的真正实力,笔者本人也是非常期望中国能够早点出现能够与阿西莫媲美的人形机器人。

相关文章
|
14小时前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
【5月更文挑战第13天】 随着计算机视觉和人工智能技术的飞速发展,深度学习已成为推动图像识别领域进步的核心动力。本文将探讨深度学习技术在图像识别中的应用,并分析其面临的主要挑战。我们将从卷积神经网络(CNN)的基础出发,探索其在图像分类、目标检测和语义分割等方面的应用实例,并针对数据偏差、模型泛化能力、计算资源需求等关键问题展开讨论。通过案例分析和性能比较,我们旨在为读者提供一个关于深度学习在图像识别中应用的全面视角,同时指出未来的研究方向和技术趋势。
|
21小时前
|
机器学习/深度学习 数据可视化 计算机视觉
深度学习在图像识别中的应用与挑战
【5月更文挑战第13天】 随着人工智能技术的飞速发展,深度学习已经成为图像识别领域的核心技术。本文将探讨深度学习在图像识别中的应用,以及在实际应用中面临的挑战。我们将介绍深度学习的基本原理,以及如何将其应用于图像识别任务。此外,我们还将讨论在实际应用中可能遇到的问题,以及如何解决这些问题。
6 2
|
21小时前
|
机器学习/深度学习 计算机视觉
深度学习在图像识别中的应用与挑战
【5月更文挑战第13天】随着人工智能技术的飞速发展,深度学习已成为图像识别领域的核心技术。本文将探讨深度学习在图像识别中的应用,以及面临的挑战和未来发展趋势。我们将介绍卷积神经网络(CNN)的基本原理,以及如何通过迁移学习和数据增强等技术提高模型性能。此外,我们还将讨论深度学习在图像识别中面临的一些挑战,如对抗性攻击、数据偏见和计算资源需求等。
7 1
|
1天前
|
机器学习/深度学习 监控 自动驾驶
深度学习在图像识别中的应用与挑战
【5月更文挑战第12天】 随着计算机视觉和人工智能技术的迅猛发展,深度学习已成为图像识别领域的核心技术。本文将探讨深度学习在图像识别中的应用,包括卷积神经网络(CNN)的基本原理、关键技术及其在不同领域中的应用案例。同时,我们将分析当前面临的主要挑战,如数据集偏差、模型泛化能力和计算资源要求,并提出可能的解决方案。通过综合评述,旨在为读者提供一个关于深度学习在图像识别中应用的全面视角。
|
1天前
|
机器学习/深度学习 数据采集 监控
基于深度学习的图像识别技术在智能监控系统中的应用
【5月更文挑战第12天】 随着人工智能技术的迅猛发展,深度学习在图像处理领域已经取得了显著的成就。尤其是在图像识别任务中,卷积神经网络(CNN)等先进模型的应用极大提高了识别精度与效率。本文旨在探讨基于深度学习的图像识别技术如何被集成到智能监控系统中,以增强其自动检测和响应异常事件的能力。通过分析现有文献和最新研究成果,文章将详细阐述相关技术原理、系统架构、以及在实际场景中的应用效果,并讨论了面临的主要挑战和未来的发展方向。
|
1天前
|
机器学习/深度学习 边缘计算 人工智能
深度学习在图像识别中的应用与挑战
【5月更文挑战第12天】 随着人工智能的迅速发展,深度学习技术在图像识别领域取得了显著的进步。本文旨在探讨深度学习模型如何有效地解决图像识别任务,并分析当前面临的主要挑战。文中将详细介绍卷积神经网络(CNN)的基础结构及其在图像分类、目标检测和语义分割中的应用。同时,将讨论数据增强、迁移学习、对抗性网络等优化策略。此外,本文也将指出模型泛化能力不足、计算资源消耗大、对小样本学习的挑战等问题,并提供可能的解决方案。
|
1天前
|
机器学习/深度学习 传感器 人工智能
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动多个科技领域前进的关键力量。特别是在图像处理和识别方面,深度学习模型已经展现出了超越传统算法的性能。本文将探讨一种基于深度卷积神经网络(CNN)的图像识别技术,并分析其在自动驾驶系统中的应用。我们将重点介绍该技术如何提高自动驾驶汽车对周围环境的感知能力,以及它在未来交通生态中的潜在影响。
|
1天前
|
机器学习/深度学习 监控 算法
深度学习在图像识别中的应用与挑战
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域进步的核心技术之一。特别是在图像识别任务中,深度神经网络通过学习海量数据中的抽象特征,显著提升了识别的准确性和效率。然而,尽管取得了显著进展,深度学习在图像识别应用中仍面临一系列挑战,包括但不限于数据集偏差、模型泛化能力、计算资源消耗以及对抗性攻击的脆弱性。本文将深入探讨深度学习技术在图像识别领域的应用现状,分析存在的挑战,并对未来发展趋势进行展望。
14 9
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
使用TensorFlow进行深度学习入门
【5月更文挑战第11天】本文引导读者入门TensorFlow深度学习,介绍TensorFlow——Google的开源机器学习框架,用于处理各种机器学习问题。内容包括TensorFlow安装(使用pip)、核心概念(张量、计算图和会话)以及构建和训练简单线性回归模型的示例。通过这个例子,读者可掌握TensorFlow的基本操作,包括定义模型、损失函数、优化器以及运行会话。
|
2天前
|
机器学习/深度学习 存储 边缘计算
深度学习在图像识别中的应用与挑战
【5月更文挑战第11天】 随着计算机视觉技术的飞速发展,深度学习已成为推动图像识别领域进步的核心动力。本文将探讨深度学习在图像识别中的应用,并分析当前面临的主要挑战。通过梳理卷积神经网络(CNN)的发展历程、关键算法及其在不同场景下的应用案例,本文揭示了深度学习技术如何有效提升图像识别的准确性与效率。同时,针对数据偏差、模型泛化能力、计算资源限制等问题,文中提出了相应的解决策略和未来发展方向。