并行计算

首页 标签 并行计算
# 并行计算 #
关注
5315内容
浅析GPU通信技术(上)-GPUDirect P2P
1. 背景 GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,GPU通信性能成为了非常重要的指标。
浅析GPU通信技术(中)-NVLink
1.  背景 上一篇文章《浅析GPU通信技术(上)-GPUDirect P2P》中我们提到通过GPUDirect P2P技术可以大大提升GPU服务器单机的GPU通信性能,但是受限于PCI Expresss总线协议以及拓扑结构的一些限制,无法做到更高的带宽,为了解决这个问题,NVIDIA提出了NVLink总线协议。
《CUDA高性能并行计算》----第1章 起 步 1.1 运行CUDA样例程序
本章带领读者进入CUDA并行计算的世界。我们将从运行一个CUDA工具箱(CUDA Toolkit)提供的样例程序开始。这个样例程序包含串行和并行两个版本,因此读者可以通过运行性能上的对比来建立CUDA是如何增强运算能力的第一印象。
| |
来自: 云原生
阿里云容器服务kubernetes发布竞价实例支持
竞价实例优化运营成本 竞价实例(Spot Instance)也叫抢占式实例是一种按需实例,旨在降低部分场景下使用ECS的成本,创建竞价实例时,必须为指定的实例规格设置一个价格上限,当指定的实例规格的当前市场价格低于出价时,就能成功创建竞价实例,并按当前市场价格计费。
CUDA从入门到精通(三):必备资料
刚入门CUDA,跑过几个官方提供的例程,看了看人家的代码,觉得并不难,但自己动手写代码时,总是不知道要先干什么,后干什么,也不知道从哪个知识点学起。这时就需要有一本能提供指导的书籍或者教程,一步步跟着做下去,直到真正掌握。
《Visual C# 2010入门经典》一1.1 .NET Framework
有关多线程和并行编程的更详细信息,请参阅第23章。 对于托管代码,并行计算平台提供了常见循环指令的并行实现和LINQ to Objects的并行实现,还新增了可避免死锁的线程安全集合。Visual Studio 2010新增了一些诊断工具,如并行分析器和处理器迁移分析,让您能够轻松地调试和优化代码
机器学习框架比较
翻译自外文网站,比较结果如下: 比较对象:Caffe,Caffe2,Deeplearning4j,Dlib,Gensim,Keras,MatConvNet,Microsoft Cognitive Toolkit,MXNet,Neural Designer,OpenNN,Paddle,Pytorch.
免费试用