国内首本免费深度学习书籍,有兴趣了解一下?

简介: 《深度学习理论与实战:提高篇》

雷锋网 AI 科技评论按:本文转自「李理的博客」,作者李理为环信人工智能研发中心 vp,有十多年自然语言处理和人工智能研发经验,主持研发过多款智能硬件的问答和对话系统,负责环信中文语义分析开放平台和环信智能机器人的设计与研发。近日,他在博客上对外公开国内首本免费的深度学习书籍——《深度学习理论与实战:提高篇》,该书籍涵盖听觉、视觉、语言和强化学习四大领域,深入浅出的理论分析和详尽的代码分析。

TB1CeJmTMHqK1RjSZFEXXcGMXXa.jpg

转载请联系作者 (fancyerii at gmail dot com)!

序言

16 年 9 月的时候我在 CSDN 发了一些深度学习的文章,主要是面向没有太多经验的开发者。达文读了后觉得我的文章比较通俗易懂,邀请我写一本书,当时头脑一热就答应下来。虽然现在出版的书籍汗牛充栋,但是对我来说著书立言始终是一件非常严肃和重大的事情。立德、立功、立言乃儒家的三不朽,可见古人对于其重视。我的这本书只是关于深度学习的技术类书籍,远远谈不上立言,但是总归会有一些读者的,因此我希望这本书至少对读者有一些帮助,而不是误人子弟。从开始写下第一个字到现在,前后跨越四年历时两年半。一方面是因为工作忙没有太多时间,但更重要的原因是我希望把它写得更好一点。写书的过程也是学习的过程,书中的每一篇论文每一行代码,作者都要求自己完全读懂,不懂的内容绝对不放到书里面。当然由于个人水平有限,肯定还是会有很多理解的偏差和疏漏,敬请读者不吝指教。

市面上关于深度学习的书籍很多,本书最大的特点是理论结合实战和内容的广度。现在大家能够看到的深度学习书籍大概可以分为两类,一类只关注理论而另一类只关注应用。前者多为一些会议论文集,当然也包括 Ian Goodfellow 和 Yoshua Bengio 等人的 Deep Learning。这类书籍的读者是专业的研究者和相关专业的学生,它更多的是关注基础理论和最新的前沿进展。这类书籍通常比较难懂,而且读完之后仍然不知道怎么动手解决问题。而另外一类书籍更关注应用,多为框架工具的介绍,偶尔提及一些理论也是点到而止,在读者看来各种算法只是一个黑盒子,虽然能跑起来,但是知其然不知其所以然,不知道怎么调优,碰到问题时更加不知道怎么解决。本书的目标是使用通俗易懂的语言来介绍基础理论和最新的进展,同时也介绍代码的实现。通过理论与实践的结合使读者更加深入的理解理论知识,同时也把理论知识用于指导实践。因此本书的一大特点就是每介绍完一个模型都会介绍它的实现,读者阅读完一个模型的介绍之后就可以运行、阅读和修改一下这些代码,从而可以更加深刻的理解理论知识。

本书第二个比较大的特点就是内容的广度,本书覆盖听觉、视觉、语言和强化学习四大领域。从章节的命名读者也可以看到作者的」野心」,本书覆盖了深度学习的大部分常见应用方向。市面上的书大部分只介绍视觉和语言的内容,而且一般也只限于 CNN 用于简单的图像分类或者 RNN、seq2seq 模型在 NLP 中的应用。本书的视觉部分除了介绍 CNN 以及最新的 ResNet 和 Inception 模型之外,还介绍了用于目标检测的 R-CNN、Fast R-CNN、Faster R-CNN 模型;用于实例分割的 Mask R-CNN 模型;用于人脸识别的 FaceNet;还包括 Neural Style Transfer 和 GAN(包括 DCGAN 和 Cycle GAN)。语言部分除了很多书都有的 RNN/LSTM/GRU 等基础模型,用于机器翻译、chatbot 的 seq2seq 模型和 Attention 机制之外还包括最新的 ELMo、OpenAI GPT 和 BERT 等模型,此外本书还介绍了 NLP 的很多经典任务,包括语言模型、词性标注、成分句法分析、依存句法分析和机器翻译。除了介绍深度学习的解决方案之外也会介绍传统的基于统计机器学习的方法,让读者能够了解这个领域的发展过程。而听觉和强化学习是目前市面上大部分书都很少提及的内容。大家都知道 2012 年 AlexNet 在视觉领域的突破,但是深度学习最早的突破其实发生在语音识别方向。本书会详细介绍经典的基于 HMM-GMM 的语音识别系统,包括基于 WFST 的解码器和 Kaldi 的用法。接着会介绍 HMM-DNN 系统,然后到最新的 End-to-End 的语音识别系统,主要会介绍 CTC 模型,包括 CTC 用于验证码识别的示例和 DeepSpeech 系统。最后会介绍使用 CNN 实现简单的语音关键词识别,这个简单的例子在智能设备上会非常有用。国内关于强化学习的书籍不多,因此本书首先用一章的篇幅介绍强化学习的基本概念,包括 MDP、动态规划、蒙特卡罗方法、TD 学习和 Policy Gradient。接着会介绍 DQN、基于深度学习的 Policy Gradient 算法,最后是介绍 AlphaGo、AlphaGo Zero 和 Alpha Zero 算法。

当然由于时间和作者的水平所限,这些领域都遗漏了很多内容,比如听觉只包括了语音识别,但是没有语音合成、Music 等;深度强化学习也没有最新的 Imitation Learning、Inverse Reinforcement Learning 和 Meta Learning 等内容。但是读者在了解了本书的基本概念和基本模型之后,要学习更新的内容也会比较容易,作者以后有时间和精力也会持续更新这些内容。

最后还包含一章哲学的内容,主要是作者对于人工智能是否可以实现的一些个人观点。本书的大部分内容都是来自别人的知识,最多是加上了我自己的一些理解。如果要在这本书里寻找一点「原创性」内容的话,最有可能就是在这一章了。里面有很多荒诞无稽的观点,但是读者不妨在饭后茶余当成消遣的文章看看也并无太大坏处,看后有什么想法也可以在后面留言和作者交流。

本书的内容参考了很多论文、书籍以及开源代码,感谢他们的工作!作者会尽量在文章加入相关链接,如果原作者认为有版权问题,请联系作者。

由于涉及的内容很广,再加上作者比较啰嗦的写作方式 (作者喜欢阅读英文书,因为很多英文书的作者把读者当小白,总是不厌其烦的解释,而大多数中文书不知道是作者水平太高还是太低,总会有太多」显然」、」易证」的东西。作者写书也是假设读者什么都不懂,所以会很啰嗦),所以几年下来写的内容竟然上千页。出版社的编辑说这么厚的书得卖多少钱啊,这没法出版。因此把这本书拆分成了两本:《深度学习理论与实战:基础篇》和《深度学习理论与实战:提高篇》。基础篇已经在编辑出版中,预计年中可以和读者见面。提高篇则更加专业,不同的人可能只关注不同的方向,为了小部分内容而购买整本书似乎不合算。所以作者把提高篇免费开放出来,希望对读者的学习和工作有所裨益。本文会持续更新,敬请关注!

草稿目录

下面是《深度学习理论与实战:提高篇》草稿的目录截图,感谢 ElegantLaTeX 免费提供的 Latex 模板。作者在整理时可能会有所调整,因此仅供参考。

TB1f8xXTSrqK1RjSZK9XXXyypXa.png TB15tljTHvpK1RjSZFqXXcXUVXa.png TB1R6phTSzqK1RjSZFjXXblCFXa.png TB129dkTQzoK1RjSZFlXXai4VXa.png

更多关于本书详情,请戳:

http://fancyerii.github.io/2019/03/14/dl-book/

雷锋网(公众号:雷锋网) AI 科技评论雷锋网

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
22天前
|
机器学习/深度学习 人工智能 自然语言处理
阿里通义千问大语言模型在人工智能教育领域的应用探索
阿里通义千问,阿里集团的大型预训练语言模型,应用于AI教育,实现个性化教学、自适应学习系统和智能答疑。通过AIGC,它生成个性化内容,适应不同学生需求,优化教育资源配置,推动教育创新。在教育场景中,模型提供实时反馈,定制学习路径,促进教学质量提升。随着技术进步,AI在教育领域的应用将更加深入,但也需关注伦理与安全。
100 1
|
16天前
|
人工智能 自然语言处理 搜索推荐
AI日报:Anthropic推出商业友好型Claude 3人工智能模型
AI日报:Anthropic推出商业友好型Claude 3人工智能模型
36 0
|
7月前
|
人工智能 Java 程序员
如何选择最适合您的AI编程工具
ChatGPT的广泛应用引发了人工智能应用场景的重大变革和实践的探索。大规模专业模型在垂直领域得到了不断深化和实施。其中,基于大模型的编码AI工具的问世大大降低了开发复杂度,提高了开发人员的工作效率,对初级开发人员尤其有帮助。
|
3月前
|
人工智能 监控 PyTorch
如何才能在阿里云服务器搭建自己的人工智能
如何才能在阿里云服务器搭建自己的人工智能
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
关于AI:“我们有话说”
人工智能是一项具有广泛应用前景和深远意义的技术
|
4月前
|
人工智能 开发者
和PAI一起,每周玩转AI【第五期】
【和PAI一起,每周玩转AI】系列活动上线了!人工智能平台PAI提供近万元免费云上资源,助力开发者们体验AIGC能力。参与每周 AIGC 主题活动,有机会赢取小米手环8、小米充电宝等多重好礼!
和PAI一起,每周玩转AI【第五期】
|
4月前
|
人工智能 自然语言处理 开发者
ChatGPT在国内的使用限制,国内的ChatGPT替代工具
ChatGPT在国内的使用限制,国内的ChatGPT替代工具
89 0
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
谷歌发布一个免费的生成式人工智能课程
在过去几周,我们看到的都是AI将如何改变生活,无论是ChatGPT的文本生成,还是SD,Midjourney 的图像生成,这些AI的特点就是都是生成式的AI。而几天前,谷歌推出了一个生成式人工智能学习课程,课程涵盖了生成式人工智能入门、大型语言模型、图像生成等主题。
230 0