Mellanox OFED2.1-X安装记录

简介: ---恢复内容开始--- 1,tcl,tk,gcc-gfortran,libnl-devel依赖包 配置个163yum源 具体见博客 http://www.cnblogs.com/ruiy/p/local-yum.html yum -y install tk tcl gcc-gfortran libnl-devel Linux OFED-user-manual 22页 两个版本的MPI MVAPICH(被俄亥俄俄州大学开发) 俄亥俄州教授D.K.Panda 发布了MVAPICH 1.8,支持GPU集群的通用、高性能的MPI。

---恢复内容开始---

1,tcl,tk,gcc-gfortran,libnl-devel依赖包

配置个163yum源

具体见博客

http://www.cnblogs.com/ruiy/p/local-yum.html

yum -y install tk tcl gcc-gfortran libnl-devel

Linux OFED-user-manual 22页

两个版本的MPI

MVAPICH(被俄亥俄俄州大学开发)

俄亥俄州教授D.K.Panda 发布了MVAPICH 1.8,支持GPU集群的通用、高性能的MPI。MVAPICH2简化MPI应用程序移植与NVIDIA GPU集群运行,并支持标准MPI调用GPU设备内存任务它以最佳方式优化了主机和GPU之间、GPU和GPU之间数据移动,而应用程序开发人员角度只需付出很少的努力,甚至不需要 MVAPICH2以为使用Infiniband10GigE/iWARPROCE网络的高性能集群提供优秀扩展容错著称
相关信息可参看http://developer.nvidia.com/mvapich 网页和俄勒冈州立大学的支持GPU基准测试
信息。

主要特点:
  • 高性能的基于RDMA的节点间的MPI至点通信GPU-GPUGPU-Host,Host-GPU
  • 高性能节点内MPI至点的多GPU通信GPU-GPUGPU-Host,Host-GPU
  • 优化和调整 GPU设备内存的MPI集体通信
  • MPI的数据类型的支持GPU设备内存的点至和集体通信
  • 节点多GPU卡通信使用了CUDA IPCCUDA4.1 支持 IPC
  • 使用CUDA事件为流水线数据的内存数据GPU传输的高效同步机制

性能:参见http://mvapich.cse.ohio-state.edu/performance/gpu.shtml

MPI

PUE(Power usage efficiency)

TCO(Total Cost Of Ownership)

http://blog.csdn.net/cwg_1992/article/details/18314141

 

 

---恢复内容结束---

1,tcl,tk,gcc-gfortran,libnl-devel依赖包

配置个163yum源

具体见博客

http://www.cnblogs.com/ruiy/p/local-yum.html

yum -y install tk tcl gcc-gfortran libnl-devel

Linux OFED-user-manual 22页

两个版本的MPI

MVAPICH(被俄亥俄俄州大学开发)

俄亥俄州教授D.K.Panda 发布了MVAPICH 1.8,支持GPU集群的通用、高性能的MPI。MVAPICH2简化MPI应用程序移植与NVIDIA GPU集群运行,并支持标准MPI调用GPU设备内存任务它以最佳方式优化了主机和GPU之间、GPU和GPU之间数据移动,而应用程序开发人员角度只需付出很少的努力,甚至不需要 MVAPICH2以为使用Infiniband10GigE/iWARPROCE网络的高性能集群提供优秀扩展容错著称
相关信息可参看http://developer.nvidia.com/mvapich 网页和俄勒冈州立大学的支持GPU基准测试
信息。

主要特点:
  • 高性能的基于RDMA的节点间的MPI至点通信GPU-GPUGPU-Host,Host-GPU
  • 高性能节点内MPI至点的多GPU通信GPU-GPUGPU-Host,Host-GPU
  • 优化和调整 GPU设备内存的MPI集体通信
  • MPI的数据类型的支持GPU设备内存的点至和集体通信
  • 节点多GPU卡通信使用了CUDA IPCCUDA4.1 支持 IPC
  • 使用CUDA事件为流水线数据的内存数据GPU传输的高效同步机制

性能:参见http://mvapich.cse.ohio-state.edu/performance/gpu.shtml

MPI

PUE(Power usage efficiency)

TCO(Total Cost Of Ownership)

http://blog.csdn.net/cwg_1992/article/details/18314141

 

 

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
8月前
|
Linux
|
Linux Shell 虚拟化
惠普HPE服务器升级iLO4固件版本
惠普HPE服务器升级iLO4固件版本
惠普HPE服务器升级iLO4固件版本
|
IDE 开发工具 Android开发
龙芯 飞腾 工作记录---1
龙芯 飞腾 工作记录---1
214 0
|
Linux 测试技术 图形学
Fedora 项目负责人“抨击” NVIDIA 专有 linux 驱动程序:建议向 Intel 和 AMD 学习“开源”
Fedora 项目负责人“抨击” NVIDIA 专有 linux 驱动程序:建议向 Intel 和 AMD 学习“开源”
163 0
Fedora 项目负责人“抨击” NVIDIA 专有 linux 驱动程序:建议向 Intel 和 AMD 学习“开源”
|
传感器 人工智能 安全
华为 nova 3i 正式发布 全新的麒麟710有何来头?
7月18日,华为在深圳大运中心体育场正式发布了 nova 3 和 nova 3i 两款手机,其中 nova 3i 手机搭载全新麒麟 710 芯片,无疑成为了是大家关注的对象。从各大媒体的硬件跑分来看,麒麟 710 定位在中端市场,整体性能与骁龙 660 处理器基本处于同一水平。
311 0
华为 nova 3i 正式发布 全新的麒麟710有何来头?
|
Oracle 关系型数据库 Go
用EMC NW的RDMA模块备份Oracle数据库,你需要在配置上使用这个诀窍
这个是个写给老外工程师的邮件,说的是使用 EMC NW 备份软件的模块备份Oracle数据库的诀窍
439 0
|
固态存储
2U 4节点Xeon SP服务器 (上):PowerEdge C6420更受重视
如今策略变化的原因是什么呢?不知您的答案是否和我一样——超融合。
2158 0