Mellanox OFED2.1-X安装记录

简介: ---恢复内容开始--- 1,tcl,tk,gcc-gfortran,libnl-devel依赖包 配置个163yum源 具体见博客 http://www.cnblogs.com/ruiy/p/local-yum.html yum -y install tk tcl gcc-gfortran libnl-devel Linux OFED-user-manual 22页 两个版本的MPI MVAPICH(被俄亥俄俄州大学开发) 俄亥俄州教授D.K.Panda 发布了MVAPICH 1.8,支持GPU集群的通用、高性能的MPI。

---恢复内容开始---

1,tcl,tk,gcc-gfortran,libnl-devel依赖包

配置个163yum源

具体见博客

http://www.cnblogs.com/ruiy/p/local-yum.html

yum -y install tk tcl gcc-gfortran libnl-devel

Linux OFED-user-manual 22页

两个版本的MPI

MVAPICH(被俄亥俄俄州大学开发)

俄亥俄州教授D.K.Panda 发布了MVAPICH 1.8,支持GPU集群的通用、高性能的MPI。MVAPICH2简化MPI应用程序移植与NVIDIA GPU集群运行,并支持标准MPI调用GPU设备内存任务它以最佳方式优化了主机和GPU之间、GPU和GPU之间数据移动,而应用程序开发人员角度只需付出很少的努力,甚至不需要 MVAPICH2以为使用Infiniband10GigE/iWARPROCE网络的高性能集群提供优秀扩展容错著称
相关信息可参看http://developer.nvidia.com/mvapich 网页和俄勒冈州立大学的支持GPU基准测试
信息。

主要特点:
  • 高性能的基于RDMA的节点间的MPI至点通信GPU-GPUGPU-Host,Host-GPU
  • 高性能节点内MPI至点的多GPU通信GPU-GPUGPU-Host,Host-GPU
  • 优化和调整 GPU设备内存的MPI集体通信
  • MPI的数据类型的支持GPU设备内存的点至和集体通信
  • 节点多GPU卡通信使用了CUDA IPCCUDA4.1 支持 IPC
  • 使用CUDA事件为流水线数据的内存数据GPU传输的高效同步机制

性能:参见http://mvapich.cse.ohio-state.edu/performance/gpu.shtml

MPI

PUE(Power usage efficiency)

TCO(Total Cost Of Ownership)

http://blog.csdn.net/cwg_1992/article/details/18314141

 

 

---恢复内容结束---

1,tcl,tk,gcc-gfortran,libnl-devel依赖包

配置个163yum源

具体见博客

http://www.cnblogs.com/ruiy/p/local-yum.html

yum -y install tk tcl gcc-gfortran libnl-devel

Linux OFED-user-manual 22页

两个版本的MPI

MVAPICH(被俄亥俄俄州大学开发)

俄亥俄州教授D.K.Panda 发布了MVAPICH 1.8,支持GPU集群的通用、高性能的MPI。MVAPICH2简化MPI应用程序移植与NVIDIA GPU集群运行,并支持标准MPI调用GPU设备内存任务它以最佳方式优化了主机和GPU之间、GPU和GPU之间数据移动,而应用程序开发人员角度只需付出很少的努力,甚至不需要 MVAPICH2以为使用Infiniband10GigE/iWARPROCE网络的高性能集群提供优秀扩展容错著称
相关信息可参看http://developer.nvidia.com/mvapich 网页和俄勒冈州立大学的支持GPU基准测试
信息。

主要特点:
  • 高性能的基于RDMA的节点间的MPI至点通信GPU-GPUGPU-Host,Host-GPU
  • 高性能节点内MPI至点的多GPU通信GPU-GPUGPU-Host,Host-GPU
  • 优化和调整 GPU设备内存的MPI集体通信
  • MPI的数据类型的支持GPU设备内存的点至和集体通信
  • 节点多GPU卡通信使用了CUDA IPCCUDA4.1 支持 IPC
  • 使用CUDA事件为流水线数据的内存数据GPU传输的高效同步机制

性能:参见http://mvapich.cse.ohio-state.edu/performance/gpu.shtml

MPI

PUE(Power usage efficiency)

TCO(Total Cost Of Ownership)

http://blog.csdn.net/cwg_1992/article/details/18314141

 

 

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
2天前
|
存储 Unix Linux
服务器数据恢复—DELL EqualLogic PS6100系列存储简介及发生故障后的处理方案
DELL EqualLogic PS6100系列存储采用虚拟ISCSI SAN阵列,支持VMware、Solaris、Linux、Mac、HP-UX、AIX操作系统,提供全套企业级数据保护和管理功能,具有可扩展性和容错功能。
|
Linux Shell 虚拟化
惠普HPE服务器升级iLO4固件版本
惠普HPE服务器升级iLO4固件版本
惠普HPE服务器升级iLO4固件版本
|
IDE 开发工具 Android开发
龙芯 飞腾 工作记录---1
龙芯 飞腾 工作记录---1
208 0
|
监控 安全 数据中心
惠普与赛门铁克联手在消费PC上捆绑数据备份软件
6月12日国际报道,惠普将捆绑赛门铁克的网络备份软件 赛门铁克表示,惠普发售的所有消费PC都捆绑上网PC数据备份订购服务。用户可以免费试用一个月网络产品——诺顿网络数据备份,一个月后的年使用费为50美元。
794 0
|
存储 虚拟化 内存技术