英特尔IDF PPT揭秘：高性能计算和深度学习发展的趋势（下）-阿里云开发者社区

英特尔IDF PPT揭秘：高性能计算和深度学习发展的趋势（下）

2017-08-01 1627

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

雷锋网(公众号：雷锋网)按：在上篇文章中，我们看到了深度学习对计算量的迫切程度。以及介绍了一款Intel为此设计的处理器：代号为KNL（Knights Landing）的高性能CPU Xeon Phi。在下篇我们将为大家展示一些深度学习语言开发者们针对这些需求和新硬件做出的调整和改进。

在上文的末尾提到了著名的开源学习框架Caffe。不过，来自伯克利大学的原始版本的Caffe语言在处理的数据规模太大时需要的时间太长了，并且默认情况下并不支持多节点、并行文件系统。因此不是很擅长超大规模的深度学习运算。不过由于Caffe是开源的，因此理论上任何人都能对其进行自己需要的改进。Caffe的多种功能事实上都有很好的被改进以支持集群并行计算的潜力。而浪潮集团在原版Caffe的基础上加以改进，开发出了第一代支持在KNL上进行丛集并行计算的Caffe版本。支持英特尔的Luster存储器、OPA网络和KNL丛集。

英特尔IDF PPT揭秘：高性能计算和深度学习发展的趋势（下）

浪潮集团将这个改进版的Caffe框架命名为Caffe架构，下图是关于Caffe-MPI在KNL上进行运算时的结构的一些解释。可以看到，其计算流程采用MPI主从模式，使用多个KNL处理器组成节点网络，主节点使用一个KNL，而从节点可以视需求由N个KNL构成，因为使用了专为HPC设计的Lustre文件系统，因此数据吞吐量并不会限制到计算和训练。OPA架构也保证了网络通信的顺畅。软件系统方面，支持Linux/Intel MKL和Mvapich2 。

英特尔IDF PPT揭秘：高性能计算和深度学习发展的趋势（下）