XGBOOST原理解析
              1.引言最近,因为一些原因,自己需要做一个小范围的XGBoost的实现层面的分享,于是干脆就整理了一下相关的资料,串接出了这份report,也算跟这里的问题相关,算是从一个更偏算法实现的角度,提供一份参考资料吧。
              
             
            
            
            
              
              开源数据库PostgreSQL攻克并行计算难题
              PostgreSQL 9.6的并行复制一发,相信已经有很多小伙伴已经开始测试了,我昨晚测试了一个场景是标签系统类应用的比特位运算,昨天测试发现性能相比非并行已经提升了7倍。昨天没有仔细研究代码,发现怎么测都只能用8个并行,今天看了一下代码,终于找到端倪了,其实并行度是由几个方面决定d , 决定并行.
              
             
            
              
              浅析GPU通信技术(上)-GPUDirect P2P
              1. 背景
GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,GPU通信性能成为了非常重要的指标。
              
             
            
              
              Schedulerx2.0分布式计算原理&最佳实践
              1. 前言
Schedulerx2.0的客户端提供分布式执行、多种任务类型、统一日志等框架,用户只要依赖schedulerx-worker这个jar包,通过schedulerx2.0提供的编程模型,简单几行代码就能实现一套高可靠可运维的分布式执行引擎。
              
             
            
            
              
              PAI分布式机器学习平台编程模型演进之路
              在云栖计算之旅第5期—大数据与人工智能大会上,来自阿里云大数据事业部的九丰分享了《PAI分布式机器学习平台编程模型演进之路》。他主要介绍了在集团中使用机器学习解决大数据问题时如何通过编程模型的演进逐步解决业务上的痛点。
              
             
            
              
              Windows 上 Caffe开发环境搭建
              Caffe是目前非常流行的深度学习框架,使用C++/CUDA编写,使用方便,性能优异,适合线上环境部署。
原生Caffe是在Linux下编译部署的。对于初学者而言,大量依赖包需要花非常大代价才能编译成功,让人望而生畏。况且在Linux下阅读代码是一件非常头疼或蛋疼的事情。
为此,研究在W
              
             
            
              
              浅析GPU通信技术(中)-NVLink
              1.  背景
上一篇文章《浅析GPU通信技术(上)-GPUDirect P2P》中我们提到通过GPUDirect P2P技术可以大大提升GPU服务器单机的GPU通信性能,但是受限于PCI Expresss总线协议以及拓扑结构的一些限制,无法做到更高的带宽,为了解决这个问题,NVIDIA提出了NVLink总线协议。