《CUDA高性能并行计算》----3.4 简化操作流程
上面所述的标准操作流是主流的工作方式,然而其中的部分过于死板和烦琐,因此一些NVIDIA专家一起努力提供了一个可替代的流式方案,叫作统一内存(unified memory)。这个方法打破了主机内存和设备内存的围墙,因此你可以只用一个可以从主机端和设备端共同访问的数组(至少看起来是这样的)。
云端TensorFlow读取数据IO的高效方式
低效的IO方式
最近通过观察PAI平台上TensoFlow用户的运行情况,发现大家在数据IO这方面还是有比较大的困惑,主要是因为很多同学没有很好的理解本地执行TensorFlow代码和分布式云端执行TensorFlow的区别。本地读取数据是server端直接从client端获得graph进行计算,而云端服务server在获得graph之后还需要将计算下发到各个worker处
阿里云异构计算产品是如何保障双11业务的
一年一度的双11购物狂欢节,是全球商家和消费者的盛会,同时也是一场技术的盛会,人脸识别,图片搜索,字符识别,语音识别,8K视频直播,智能推荐,语音助手等最先进的技术手段被广泛使用,为大促的各个环节保驾护航。
基于NVIDIA处理器 阿里云发布GPU GN4
本文讲的是基于NVIDIA处理器 阿里云发布GPU GN4【IT168 资讯】3月6日, 阿里云正式对外发布高性能计算实例GN4。 新品基于NVIDIA处理器,是一款通用型GPU实例,特别适用于深度学习和高性能计算的。支持小时付费,也支持包月包年。