CUDA实践指南(三十三)

简介:

何处安装重新分配的CUDA库:
一旦正确的库文件被识别为重新分发,它们必须被配置为安装到应用程序能够找到它们的位置。
在Windows上,如果CUDA Runtime或其他动态链接的CUDA Toolkit库与可执行文件放在同一目录中,则Windows将自动找到它。 在Linux和Mac上,应使用-rpath链接器选项来指示可执行文件在搜索系统路径之前搜索其本地路径以查找这些库:
Linux/Mac:

nvcc -I $(CUDA_HOME)/include
-Xlinker "-rpath '$ORIGIN'" --cudart=shared
-o myprogram myprogram.cu

Windows:

nvcc.exe -ccbin "C:\vs2008\VC\bin"
-Xcompiler "/EHsc /W3 /nologo /O2 /Zi /MT" --cudart=shared
-o "Release\myprogram.exe" "myprogram.cu"

可能需要调整-ccbin的值以反映Visual Studio安装的位置。
要指定将要分发库的备用路径,请使用类似于下面的链接器选项:
Linux/Mac:

nvcc -I $(CUDA_HOME)/include
-Xlinker "-rpath '$ORIGIN/lib'" --cudart=shared
-o myprogram myprogram.cu

Windows

nvcc.exe -ccbin "C:\vs2008\VC\bin"
-Xcompiler "/EHsc /W3 /nologo /O2 /Zi /MT /DELAY" --cudart=shared
-o "Release\myprogram.exe" "myprogram.cu"

对于Linux和Mac,像以前一样使用-rpath选项。 对于Windows,使用/ DELAY选项; 这要求应用程序在首次调用任何CUDA API函数之前调用SetDllDirectory()以指定包含CUDA DLL的目录。
对于Windows 8,应该使用SetDefaultDLLDirectories()和AddDllDirectory()代替SetDllDirectory()。 请参阅这些例程的MSDN文档以获取更多信息。
部署基础设施工具:
Nvidia-SMI:
NVIDIA系统管理界面(nvidia-smi)是一个命令行工具,可帮助管理和监控NVIDIA GPU设备。 该实用程序允许管理员查询GPU设备状态,并以适当的权限允许管理员修改GPU设备状态。 nvidia-smi瞄准特斯拉和某些Quadro GPU,但其他NVIDIA GPU上也有有限的支持。 nvidia-smi在Linux上配有NVIDIA GPU显示驱动程序,以及64位Windows Server 2008 R2和Windows 7. nvidia-smi可将查询的信息输出为XML或作为人类可读的纯文本输出到标准输出或文件。 有关详细信息,请参阅nvidia-smi文档。 请注意,新版本的nvidia-smi不保证与以前的版本向后兼容。
可查询状态:
ECC错误计数:
报告可纠正的单比特和可检测的双比特错误。 为当前引导周期和GPU的使用期限提供错误计数。
GPU利用率
报告GPU和存储器接口的计算资源的当前利用率。
活动计算进程
报告运行在GPU上的活动进程列表以及相应的进程名称/ ID和分配的GPU内存。
时钟和性能状态
最大和当前时钟速率也报告几个重要的时钟域
作为当前的GPU性能状态(pstate)。
温度和风扇速度
报告当前的GPU核心温度,以及主动冷却产品的风扇速度。
功率管理
报告的产品报告了当前的电路板功率消耗和功率限制
这些测量。
鉴定
报告了各种动态和静态信息,包括主板序列号,PCI设备ID,VBIOS / Inforom版本号和产品名称。

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
Kubernetes 负载均衡 网络协议
【2023】分享一份网友的Linux运维面试题
【2023】分享一份网友的Linux运维面试题
730 0
|
6月前
|
弹性计算 监控 安全
实测阿里云操作系统控制台:功能、诊断与优化
阿里云操作系统(AliOS)是阿里巴巴专为物联网和智能设备开发的操作系统,提供高效、安全、智能化的解决方案。本文介绍了如何开通和使用阿里云的云服务器ECS,包括注册、选择操作系统、创建用户及授权等步骤。通过控制台,用户可以实时监控设备状态、管理组件、进行性能诊断,并优化资源使用。掌握这些功能有助于提升系统管理和数据处理能力,满足物联网场景的多样化需求。建议进一步丰富系统健康指标和观测功能,以提供更好的用户体验。
384 24
|
10月前
|
API 开发者 Python
探索Python中的异步编程:Asyncio与Tornado的对决
在这个快节奏的世界里,Python开发者面临着一个挑战:如何让代码跑得更快?本文将带你走进Python异步编程的两大阵营——Asyncio和Tornado,探讨它们如何帮助我们提升性能,以及在实际应用中如何选择。我们将通过一场虚拟的“对决”,比较这两个框架的性能和易用性,让你在异步编程的战场上做出明智的选择。
|
存储 安全 Linux
【探索Linux】P.18(进程信号 —— 信号捕捉 | 信号处理 | sigaction() )
【探索Linux】P.18(进程信号 —— 信号捕捉 | 信号处理 | sigaction() )
305 0
|
11月前
|
运维 监控 安全
SD-WAN异地组网加速:提升企业网络性能的关键
随着企业全球化扩展,异地组网成为重要需求。传统广域网(WAN)存在延迟高、带宽不足等问题,而SD-WAN通过智能流量调度、降低成本、提升安全性和快速部署等优势,成为理想解决方案。本文详细解析SD-WAN在异地组网中的优势、应用场景及最佳实践,帮助企业实现高效跨地域网络连接。
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之如何识别并执行某个字段的 SQL 语句,并输出结果
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
252 2
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在智能客服系统中的应用
【8月更文挑战第31天】本文将介绍AI技术在智能客服系统中的应用,包括自然语言处理、机器学习和深度学习等方面的知识。我们将通过一个简单的代码示例,展示如何使用Python和TensorFlow库构建一个简单的智能客服系统。通过阅读本文,您将了解到AI技术如何改变传统客服行业,提高客户满意度和企业效率。
|
数据采集 数据可视化 数据挖掘
数据解码:掌握多种方法剖析调查问卷结果
在完成问卷调查后,关键在于数据分析。步骤包括数据清洗(删除重复和处理缺失值)、排列分类,以及描述统计(平均数、中位数、众数、标准差和方差)来理解数据分布。相关性分析(如Pearson和Spearman系数、相关性矩阵)揭示变量间的关系,而统计推断(t检验、方差分析和回归分析)评估显著差异和因果关系。文本分析(关键词提取、情感分析和主题建模)则洞察受访者的情感和主题。Zoho Survey提供工具支持这些分析,助力决策制定。
283 1
|
JSON JavaScript 大数据
轻松搞定 excel 的 导入 和 导出
轻松搞定 excel 的 导入 和 导出
292 0