Jetson TX2 初体验
# 0. 简介
Jetson TX2【1】是基于 NVIDIA Pascal™ 架构的 AI 单模块超级计算机,性能强大(1 TFLOPS),外形小巧,节能高效(7.5W),非常适合机器人、无人机、智能摄像机和便携医疗设备等智能终端设备。
Schedulerx2.0分布式计算原理&最佳实践
1. 前言
Schedulerx2.0的客户端提供分布式执行、多种任务类型、统一日志等框架,用户只要依赖schedulerx-worker这个jar包,通过schedulerx2.0提供的编程模型,简单几行代码就能实现一套高可靠可运维的分布式执行引擎。
Windows 上 Caffe开发环境搭建
Caffe是目前非常流行的深度学习框架,使用C++/CUDA编写,使用方便,性能优异,适合线上环境部署。
原生Caffe是在Linux下编译部署的。对于初学者而言,大量依赖包需要花非常大代价才能编译成功,让人望而生畏。况且在Linux下阅读代码是一件非常头疼或蛋疼的事情。
为此,研究在W
浅析GPU通信技术(中)-NVLink
1. 背景
上一篇文章《浅析GPU通信技术(上)-GPUDirect P2P》中我们提到通过GPUDirect P2P技术可以大大提升GPU服务器单机的GPU通信性能,但是受限于PCI Expresss总线协议以及拓扑结构的一些限制,无法做到更高的带宽,为了解决这个问题,NVIDIA提出了NVLink总线协议。