异构计算

首页 标签 异构计算
# 异构计算 #
关注
17397内容
| |
来自: 云原生
基于阿里云容器服务监控 Kubernetes集群GPU指标
### 简介 当您在阿里云容器服务中使用GPU ECS主机构建Kubernetes集群进行AI训练时,经常需要知道每个Pod使用的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等监控信息,本文介绍如何快速在阿里云上构建基于Prometheus + Grafana的GPU监控方案。
免费公测中-GPU数据库SQream DB正式上线云市场
继2018年2月,业内领先的GPU数据库公司SQream正式与阿里云签署合作协议后,GPU 数据库服务SQream DB在阿里云云市场正式开启公测,敬请期待。
扫盲人工智能的计算力基石--异构计算
本文将带领入门读者了解CPU,GPU,FPGA,ASIC和异构计算的一些基本概念和优缺点,希望帮助入门者和爱好者建立基本的芯片概念
| |
来自: 云原生
像Google一样构建机器学习系统3 - 利用MPIJob运行ResNet101
从上篇文章中,我们可以看到如何通过Kubeflow Pipeline运行单节点任务机器学习工作流,在本文中,我们会介绍如何使用Pipeline运行分布式MPI任务,该MPI任务运行模型ResNet101的测试。
玩转ECS -- 2020修炼手册(第1季)
ECS弹性计算本季新技能全Get,助您成本优化,高效运维,安全容灾。ECS, autoscaling, ROS, OOS, ECI全都有,让你玩转ECS家族产品。还有5000元大奖活动等你来赢!
H.265/HEVC视频编码:FPGA GPU QSV实现对比
相对于H.264,H.265有更好的压缩率和画质,更适应高分辨率视频流的压缩处理。随着视频素材分辨率、帧率的不断增加,如何高效、灵活、高质量、低成本地去实现H.265编码成为研究的热点。
浅析GPU通信技术(上)-GPUDirect P2P
1. 背景 GPU在高性能计算和深度学习加速中扮演着非常重要的角色, GPU的强大的并行计算能力,大大提升了运算性能。随着运算数据量的不断攀升,GPU间需要大量的交换数据,GPU通信性能成为了非常重要的指标。
| |
来自: 云原生
Kubeflow实战系列: 利用TFJob运行分布式TensorFlow
TensorFlow作为现在最为流行的深度学习代码库,在数据科学家中间非常流行,特别是可以明显加速训练效率的分布式训练更是杀手级的特性。但是如何真正部署和运行大规模的分布式模型训练,却成了新的挑战。
Apache Spark 3.0 将内置支持 GPU 调度
如今大数据和机器学习已经有了很大的结合,在机器学习里面,因为计算迭代的时间可能会很长,开发人员一般会选择使用 GPU、FPGA 或 TPU 来加速计算。在 Apache Hadoop 3.1 版本里面已经开始内置原生支持 GPU 和 FPGA 了。
免费试用