• 关于

    GPU 主机系统

    的搜索结果
  • 《OpenACC并行程序设计:性能优化实践指南》一 3.9 增加GPU任务并行

    3.9 增加GPU任务并行 在图3-10中,放大主机-设备的追踪数据,可以看出在一些内核启动和开始执行内核间有时间差。此外,因为同步主机与GPU间的数据拷贝,所以GPU依旧有时空闲。使用CUDA流引入异步GPU活动,来确保PIConGPU可以向GPU发送更多的任务,让GPU找出最好的处理方式。图3...

    文章 华章计算机 2017-09-11 882浏览量

  • CUDA实践指南(一)

    评估您的应用程序:从超级计算机到手机,现代处理器越来越依赖并行性来提供性能。 核心计算单元(包括控制,算术,寄存器和典型的一些缓存)被复制一定次数并通过网络连接到内存。 因此,所有现代处理器都需要并行代码,以便充分利用其计算能力。在处理器不断发展以向程序员公开更多细粒度的并行性时,许多现有的应用程...

    文章 night李 2018-02-27 1626浏览量

  • 手把手教你启用RemoteFX以及Hyper-V GPU卸载

    微软的RemoteFX特性可以帮助改善虚拟机图形密集型应用工作负载的性能。 服务器虚拟化已经成熟到大多数工作负载都能够在虚拟机内运行的程度。毫无疑问,与其他工作负载相比,某些工作负载在虚拟机内运行将面临更多的挑战,例如图形密集型应用一直面临挑战。因为正常情况下,虚拟机内的图形处理是由服务器的CPU...

    文章 青衫无名 2017-07-03 4028浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 弹性计算双周刊 第 10 期

    【最新动态】 1、ECS全新一代超高性能ESSD云盘产品正式上线公测,当前已在华北2(北京)可用区G提供公测资源。欢迎通过工单申请公测资格,进行购买试用!更多产品信息,请点击购买 2、ECS API支持批量创建包年包月云服务器 除了可以在ECS控制台或者售卖页创建ECS之外,您可以使用OpenAp...

    文章 宝惜 2018-07-25 6343浏览量

  • CUDA学习(九十四)

    数据迁移和一致性:统一内存通过将数据迁移到正在访问的设备(即将数据移动到主机内存(如果CPU正在访问它,并将数据移动到设备内存,如果GPU将访问它),来尝试优化内存性能)。 数据迁移是统一内存的基础,但对于程序而言是透明的。 系统会尝试将数据放置在最有效访问的位置,而不会违反一致性。数据的物理位置...

    文章 night李 2018-02-24 1418浏览量

  • 《CUDA C编程权威指南》——1.2 异构计算

    本节书摘来自华章计算机《CUDA C编程权威指南》一书中的第1章,第1.2节,作者 [美] 马克斯·格罗斯曼(Max Grossman),译 颜成钢 殷建 李亮,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 异构计算 最初,计算机只包含用来运行编程任务的中央处理器(CPU)。近年...

    文章 华章计算机 2017-07-03 1834浏览量

  • 使用云监控实现GPU云服务器的GPU监控和报警(下)-云监控插件监控

    目录 使用云监控实现GPU云服务器的GPU监控和报警(上) - 自定义监控 使用云监控实现GPU云服务器的GPU监控和报警(下)- 云监控插件监控 1     背景 上一篇文章我们介绍了如何使用阿里云云监控服务提供的自定义监控功能,利用自定义监控提供的API或者SDK,通过自定义脚本可以将GPU云...

    文章 撷峰 2018-07-13 3750浏览量

  • 《CUDA C编程权威指南》——1.2节异构计算

    本节书摘来自华章社区《CUDA C编程权威指南》一书中的第1章,第1.2节异构计算,作者[美] 马克斯·格罗斯曼(Max Grossman) ,更多章节内容可以访问云栖社区“华章社区”公众号查看 1.2 异构计算最初,计算机只包含用来运行编程任务的中央处理器(CPU)。近年来,高性能计算领域中的主...

    文章 华章计算机 2017-05-02 1513浏览量

  • 《CUDA C编程权威指南》——第2章 CUDA编程模型 2.1 CUDA编程模型概述

    本节书摘来自华章计算机《CUDA C编程权威指南》一书中的第2章,第2.1节,作者 [美] 马克斯·格罗斯曼(Max Grossman),译 颜成钢 殷建 李亮,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第2章 CUDA编程模型 本章内容: 写一个CUDA程序 执行一个核函数 用网...

    文章 华章计算机 2017-07-03 4522浏览量

  • 《CUDA C编程权威指南》——2.1节CUDA编程模型概述

    本节书摘来自华章社区《CUDA C编程权威指南》一书中的第2章,第2.1节CUDA编程模型概述,作者[美] 马克斯·格罗斯曼(Max Grossman),更多章节内容可以访问云栖社区“华章社区”公众号查看 2.1 CUDA编程模型概述CUDA编程模型提供了一个计算机架构抽象作为应用程序和其可用硬件...

    文章 华章计算机 2017-05-02 2834浏览量

  • CUDA学习(一百)

    语言整合:使用nvcc编译主机代码的CUDA Runtime API用户可以通过<<< ... >>>运算符访问其他语言集成功能,例如共享符号名称和内联内核启动。 Unified Memory为CUDA的语言集成增加了一个额外元素:用__managed__关键字...

    文章 night李 2018-02-25 1617浏览量

  • 深度学习系统镜像(预装NVIDIA GPU驱动和深度学习框架)

    深度学习系统镜像一键安装简单方便,无需手动安装GPU驱动和深度学习框架,码笔记分享阿里云深度学习操作系统镜像,这款镜像是免费使用的,基于CentOS 7.3 64位系统,预装NVIDIA GPU驱动、TensorFlow、MXNet开源深度学习框架: 深度学习镜像操作系统 镜像来源:阿里云镜...

    文章 云专家云 2020-03-25 763浏览量

  • 深度学习系统镜像(预装NVIDIA GPU驱动和深度学习框架)

    深度学习系统镜像一键安装简单方便,无需手动安装GPU驱动和深度学习框架,码笔记分享阿里云深度学习操作系统镜像,这款镜像是免费使用的,基于CentOS 7.3 64位系统,预装NVIDIA GPU驱动、TensorFlow、MXNet开源深度学习框架: 深度学习镜像操作系统 镜像来源:阿里云镜像...

    文章 新手站长网 2020-03-25 756浏览量

  • CUDA学习(九十二)

    统一的存储器编程:统一内存简介:Unified Memory是CUDA编程模型的一个组件,首次在CUDA 6.0中引入,该模型定义了一个托管内存空间,其中所有处理器都可以看到具有公共地址空间的单个一致内存映像。(处理器是指具有专用MMU的任何独立执行单元。 这包括任何类型和架构的CPU和GPU。)...

    文章 night李 2018-02-24 1810浏览量

  • CUDA实践指南(三十)

    准备部署:测试CUDA可用性:部署CUDA应用程序时,通常需要确保即使目标计算机没有支持CUDA的GPU和/或已安装足够版本的NVIDIA驱动程序,应用程序仍能正常运行。检测具有CUDA功能的GPU:当应用程序将被部署到目标机器的任意/未知配置时,应用程序应该明确地测试是否存在CUDAcapabl...

    文章 night李 2018-02-28 1651浏览量

  • CUDA学习(九十六)

    一致性和并发性:在计算能力低于6.x的设备上同时访问托管内存是不可能的,因为如果CPU在GPU内核处于活动状态时访问统一内存分配,则无法保证一致性。 但是,支持操作系统的计算能力6.x设备允许CPU和GPU通过新的页面错误机制同时访问统一内存分配。 程序可以通过检查新的concurrentMana...

    文章 night李 2018-02-25 1257浏览量

  • 基于阿里云容器服务监控 Kubernetes集群GPU指标

    简介 当您在阿里云容器服务中使用GPU ECS主机构建Kubernetes集群进行AI训练时,经常需要知道每个Pod使用的GPU的使用情况,比如每块显存使用情况、GPU利用率,GPU卡温度等监控信息,本文介绍如何快速在阿里云上构建基于Prometheus + Grafana的GPU监控方案。 Pr...

    文章 萧元 2018-10-08 14894浏览量

  • Hyper-V 2016 系列教程18 Windows 上的 Hyper-V 和 Windows Server 上的 Hyper-V 之间的差异

      对于某些功能来说,其工作方式在 Windows 上的 Hyper-V 中和在运行于 Windows Server 上的 Hyper-V 中不同。        对于 Windows 上的 Hyper-V,内存管理模块不同。 在服务器上,通过假设只有虚拟机在该服务器上运行来管理 Hyper-V ...

    文章 科技小先锋 2017-11-15 1103浏览量

  • 使用TensorFlow,GPU和Docker容器进行深度学习

    在过去的几个月中,我和多个企业的数据科学团队进行了多次合作,也看到越来越多的机器学习和深度学习框架被广泛应用到实际生活中。 与大数据分析和数据科学中的其他用例一样,这些团队希望在BlueData EPIC软件平台上的Docker容器中运行他们最喜欢的深度学习框架和工具。因此,我的一部分工作就是尝试...

    文章 【方向】 2018-03-05 7242浏览量

  • CUDA学习(九十七)

    显式同步和逻辑GPU活动:请注意,即使内核在上述示例中快速运行并在CPU触及y之前完成,也需要显式同步。 Unified Memory使用逻辑活动来确定GPU是否空闲。 这与CUDA编程模型保持一致,该模型指定内核可以在启动后随时运行,并且不能保证在主机发出同步调用之前完成。逻辑上保证GPU完成其...

    文章 night李 2018-02-25 1296浏览量

  • 阿里云郑晓:浅谈GPU虚拟化技术(第三章)

    第三章 浅谈GPU虚拟化技术(三)GPU SRIOV及vGPU调度 GPU SRIOV原理 谈起GPU SRIOV那么这个世界上就只有两款产品:S7150和MI25。都出自AMD,当然AMD的产品规划应该是早已安排到几年以后了,未来将看到更多的GPU SRIOV产品的升级换代。S7150针对的是图...

    文章 阿里云头条 2018-04-25 7801浏览量

  • CUDA学习(九十三)

    简化GPU编程:存储空间的统一意味着主机和设备之间不再需要显式存储器传输。 在托管内存空间中创建的任何分配都会自动迁移到需要的位置。程序以两种方式之一分配托管内存:通过cudaMallocManaged()例程,它在语义上类似于cudaMalloc(); 或者通过定义一个全局的__managed_...

    文章 night李 2018-02-24 1224浏览量

  • 《多核与GPU编程:工具、方法及实践》----1.3 现代计算机概览

    本节书摘来自华章出版社《多核与GPU编程:工具、方法及实践》一书中的第1章,第1.3节, 作 者 Multicore and GPU Programming: An Integrated Approach[阿联酋]杰拉西莫斯·巴拉斯(Gerassimos Barlas) 著,张云泉 贾海鹏 李...

    文章 华章计算机 2017-05-02 1961浏览量

  • CUDA实践指南(十)

    存储器优化:内存优化是性能最重要的领域。 目标是通过最大化带宽来最大限度地利用硬件。 使用尽可能多的快速内存和尽可能少的慢速访问内存可以更好地提供带宽。 本章讨论主机和设备上的各种内存以及如何最好地设置数据项以有效使用内存。主机和设备之间的数据传输:设备内存与GPU之间的峰值理论带宽要高得多(例如...

    文章 night李 2018-02-28 1072浏览量

  • 弹性计算双周刊 第 25 期

    【重点关注】阿里云GPU云服务器现已支持NVIDIA RAPIDS加速库,是国内第一家提供RAPIDS加速库服务的公有云厂商RAPIDS,全称Real-time Acceleration Platform for Integrated Data Science,是NVIDIA针对数据科学和机器学习...

    文章 宝惜 2019-06-04 5249浏览量

  • 《CUDA C编程权威指南》——2.2 给核函数计时

    本节书摘来自华章计算机《CUDA C编程权威指南》一书中的第2章,第2.2节,作者 [美] 马克斯·格罗斯曼(Max Grossman),译 颜成钢 殷建 李亮,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 给核函数计时 在内核的性能转换过程中,了解核函数的执行需要多长时间是很有...

    文章 华章计算机 2017-07-03 1944浏览量

  • 阿里NIPS 2017论文解读:如何降低TensorFlow训练的显存消耗?

    NIPS 2017阿里巴巴展台-阿里巴巴iDST院长金榕在做演讲 这篇介绍深度模型训练GPU显存优化的论文《TrainingDeeper Models by GPU Memory Optimization on TensorFlow》在NIPS 2017 ML Systems Workshop 中...

    文章 技术小能手 2017-12-11 4793浏览量

  • ovirt官方安装文档 附录F

    附录G:为PCI传输配置主机 启用PCI直通允许虚拟机使用主机设备,就像设备直接连接到虚拟机一样。要启用PCI直通功能,您需要启用虚拟化扩展和IOMMU功能。以下过程需要您重新启动主机。如果主机已连接到管理器,请确保在执行以下步骤之前将主机置于维护模式。 先决条件: 确保主机硬件符合PCI设备直...

    文章 技术小阿哥 2017-11-26 1009浏览量

  • ovirt官方安装文档 附录G

    附录G:为PCI传输配置主机 启用PCI直通允许虚拟机使用主机设备,就像设备直接连接到虚拟机一样。要启用PCI直通功能,您需要启用虚拟化扩展和IOMMU功能。以下过程需要您重新启动主机。如果主机已连接到管理器,请确保在执行以下步骤之前将主机置于维护模式。 先决条件: 确保主机硬件符合PCI设备直...

    文章 技术小阿哥 2017-11-28 945浏览量

  • 阿里云郑晓:浅谈GPU虚拟化技术(第三章)

    本系列文章推送门: 阿里云郑晓:浅谈GPU虚拟化技术(第一章) GPU虚拟化发展史  阿里云郑晓:浅谈GPU虚拟化技术(第二章)GPU虚拟化方案之——GPU直通模式 今天一个小伙伴@...

    文章 郑晓 2018-05-08 8689浏览量

1 2 3 4 ... 11 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化