前言
“深度学习”一词大家已经不陌生了,随着在不同领域取得了超越其他方法的成功,深度学习在学术界和工业界掀起了一次神经网络发展史上的新浪潮。运用深度学习解决实际问题,不仅是学术界高素质人才所需的技能,而且是工业界商业巨头进行竞争的核心武器。为适应这一发展的需要,作者以长期的相关研究和教学工作为基础,经过2~3年的调研和努力,终于编写完本书。这是一本关于深度学习的入门教材和导论性参考书,受众对象包括计算机、自动化、信号处理、机电工程、应用数学等相关专业的研究生、教师和科研工作者,本书有助于他们在具备神经网络的基础知识后进一步了解深度学习的理论和方法。
自2006年诞生以来,深度学习很快成长壮大,并有一些相关的英文书籍陆续出版。虽然国内也开始出现译著,但对深度学习的内容概括得并不全面,远不能够满足市场需求。本书的内容几乎涵盖了深度学习的所有重要方面,结构上分为基础理论和案例分析两个部分。在基础理论部分,本书不仅介绍了深度学习的起源和发展、特点和优势,而且描述了深度学习的9种重要模型,包括受限玻耳兹曼机、自编码器、深层信念网络、深层玻耳兹曼机、和积网络、卷积神经网络、深层堆叠网络、循环神经网络和长短时记忆网络。此外,还讨论了这些模型的学习算法、变种模型和混合模型,以及它们在图像视频处理、音频处理和自然语言处理等领域中的广泛应用,并总结了有关的开发工具、问题和挑战。在案例分析部分,本书主要挑选了一些深度学习的程序案例进行细致的说明和分析,指导读者学习有关的程序代码和开发工具,以便在解决实际问题时加以灵活利用。其中,每个程序案例都包括模块简介、运行过程、代码分析和使用技巧这4个部分,层次结构清晰,以利于读者选择和学习,并在应用中拓展思路。本书的一个不足之处是:案例分析部分没有涉及“和积网络”和“深层堆叠网络”,这是因为和积网络的运行需要大规模集群的硬件条件,另外也很难找到便于构造深层堆叠网络案例的程序代码。
本书的一大特色是从初学者的角度出发,在知识结构的布局上注重深入浅出,对深度学习的模型涵盖得较全面,文献引用非常丰富,既适合读者入门学习,又有助于他们深入钻研。同时,本书也试图纠正许多读者对深度学习的一些错误理解,比如认为多层感知器不是深度学习模型,认为自编码器能够直接用来识别手写字符,认为受限玻耳兹曼机也是严格意义上的深度学习模型,等等。
本书的另一个特色是通过程序案例介绍深度学习模型。这对缺乏相关背景知识的读者可能非常有帮助,使他们在知其然不知其所以然的情况下运行深度学习程序并获得计算结果,从而在积累实践经验和感性认识的过程中逐步了解深度学习的有关内容。本书的案例涉及三种常见的编程语言:Matlab、Python和C++。其中,很多深度学习程序是用Matlab编写的,可以直接运行。如果使用Python语言编写深度学习程序,则可以调用Theano开源库;若使用C++语言,则可以调用Caffe开源库。不同的语言分析案例有助于读者全面了解深度学习模型和算法的实现途径,并根据自己的熟练程度灵活选择。
本书是集体智慧的结晶。北京工业大学计算机学院的刘波、胡海鹤和刘兆英等老师,以及张亚红、曾少锋、沈成恺、杨红丽和丁勇等同学,在文献和软件资料的收集整理方面提供了很大帮助。此外,华章公司的温莉芳副总经理对本书的出版给予了大力支持,张梦玲编辑对本书内容的编排提出了许多宝贵意见。在这里向他们表示衷心的感谢。
最后,还要感谢父母、爱人和儿女在本书写作期间给予的理解,感谢他们的真情鼓励、默默付出以及对非规律生活的宽容。同时,作者在此也因减少了对他们的关爱而深表愧疚和歉意。
限于作者水平,本书在内容取材和结构编排上可能存在不妥之处,希望使用本书的教师、学生、专家以及其他读者提出宝贵的批评和建议。
出版在【华章出版社】 作者:
李玉鑑 张婷 等
-------------------------
感谢分享!
-------------------------
感谢分享!
-------------------------
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。