如何监控NVIDIA Jetson的的运行状态和使用情况

简介: NVIDIA Jetson是NVIDIA为新一代自主机器设计的嵌入式系统,是一个AI平台,所提供的性能和能效可提高自主机器软件的运行速度。每个系统都是一个完备的模块化系统,具备CPU、GPU、PMIC、DRAM和闪存。Jetson具备可扩展性,选择应用场合的SOM,即能够以此为基础构建自定义系统,满足应用需求。

一、NVIDIA Jetson介绍


NVIDIA Jetson是NVIDIA为新一代自主机器设计的嵌入式系统,是一个AI平台,所提供的性能和能效可提高自主机器软件的运行速度。每个系统都是一个完备的模块化系统,具备CPU、GPU、PMIC、DRAM和闪存。Jetson具备可扩展性,选择应用场合的SOM,即能够以此为基础构建自定义系统,满足应用需求。


二、jetson-stats监控NVIDIA Jetson的的运行状态和使用情况


jetson-stats是一个用于监视和控制您的NVIDIA Jetson [Orin 系列、Xavier 系列、Nano、TX1、TX2] 的软件包,适用于所有 NVIDIA Jetson 生态系统。


2.1安装


# 终端输入
sudo -H pip install -U jetson-stats


它是一个在终端上运行的系统监控实用程序,可以实时查看和控制您的NVIDIA Jetson的状态。CPU、RAM、GPU状态和频率等.


您可以使用简单的命令运行 jtop simplejtop


nvidia@jetson-xavier-nx:~/$ jtop
# 其他选项可通过-h以下选项获得:
nvidia@jetson-xavier-nx:~/$ jtop -h
usage: jtop [-h] [--no-warnings] [--restore] [--loop] [-r REFRESH] [-p PAGE]
            [-v]
jtop is system monitoring utility and runs on terminal
optional arguments:
  -h, --help            show this help message and exit
  --no-warnings         Do not show warnings (default: False)
  --restore             Reset Jetson configuration (default: False)
  --loop                Automatically switch page every 5s (default: False)
  -r REFRESH, --refresh REFRESH
                        refresh interval (default: 500)
  -p PAGE, --page PAGE  Open fix page (default: 1)
  -v, --version         show program's version number and exit


2.2 使用效果


您可以使用向左、向右箭头或TAB更改页面来更改页面。


7d7f75454b0546699d4ddda7e20653b1.gif


2.3 页面介绍


jtop有四个不同的页面来控制您的 NVIDIA Jetson:


1.ALL收集有关您的主板的所有信息:CPU 状态、内存、GPU、磁盘、风扇以及有关 jetson_clocks、NVPmodel 和其他的所有状态


2.GPU有关您的 NVIDIA Jetson 的实时 GPU 历史记录


3.CPU NVIDIA Jetson 的实时 CPU 图


4.MEM实时内存图表和交换监视器


5.CTRL直接从此处启用/禁用jetson_clocks、nvpmodel或风扇


6.INFO有关库、CUDA、序列号、接口等的所有信息


2.4 其他命令


2.4.1 jetson_release -v


jetson_release -v

5578ffc580a54a8495e1b364945c5870.png


2.4.2 jetson_swap


简单的管理器,用于打开和关闭您的 jetson 中的交换文件。


nvidia@jetson-nano:~/$ sudo jetson_swap -h
usage: createSwapFile [[[-d directory ] [-s size] -a] | [-h] | [--off]]
  -d | --dir    <directoryname> Directory to place swapfile
  -n | --name   <swapname> Name swap file
  -s | --size   <gigabytes>
  -a | --auto   Enable swap on boot in /etc/fstab 
  -t | --status Check if the swap is currently active
  --off         Switch off the swap
  -h | --help   This message


2.4.3 jetson variables


在 bash 中安装 jetson-stats 时,将提供一个新环境变量列表,以了解您正在使用哪个硬件版本、安装了哪个 Jetpack 以及其他变量如下所示:


f7efacc5a61345a78eea5dde5d8ba723.png

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
3月前
|
弹性计算 运维 监控
GPU实例使用--vGPU驱动自动安装和升级
为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高。
GPU实例使用--vGPU驱动自动安装和升级
|
Linux 异构计算 Python
【linux】nvidia-smi 查看GPU使用率100%
nvidia-smi 查看GPU使用率一直是100%解决办法
【linux】nvidia-smi 查看GPU使用率100%
|
Prometheus 监控 异构计算
阿里云容器服务GPU监控2.0基础篇3:监控NVIDIA XID错误
本系列相关文章:阿里云容器服务GPU监控2.0基础篇1:基本功能使用阿里云容器服务GPU监控2.0基础篇2:监控NVLINK带宽阿里云容器服务GPU监控2.0基础篇3:监控NVIDIA XID错误阿里云容器服务GPU监控2.0进阶篇1:剖析(Profiling)GPU使用情况必备知识阿里云容器服务GPU监控2.0进阶篇2:学会剖析(Profiling)GPU使用情况本篇文章将向您介绍如何使用GPU
4791 0
阿里云容器服务GPU监控2.0基础篇3:监控NVIDIA XID错误
Ubuntu20.04实时显示CPU、内存、网速
Ubuntu20.04实时显示CPU、内存、网速
1126 0
Ubuntu20.04实时显示CPU、内存、网速
|
传感器 监控 Ubuntu
Linux下监控CPU和GPU温度的三款命令行工具
如今,即使技术已经日新月异,但是笔记本电脑的散热还是一个常见问题。监视硬件温度可以帮助您诊断笔记本电脑过热的原因。
4559 0
Linux下监控CPU和GPU温度的三款命令行工具
|
5天前
|
Linux
NVIDIA 配置 Jetson 扩展针座(下)
NVIDIA 配置 Jetson 扩展针座
13 2
|
5天前
|
传感器 文件存储 SoC
NVIDIA 配置 Jetson 扩展针座(上)
NVIDIA 配置 Jetson 扩展针座
21 2
|
9月前
|
监控 调度 Python
电脑监控软件所含的CPU资源监控的代码(使用psutil库)
本文使用psutil库来获取CPU使用率、运行的进程、CPU温度、风扇速度和CPU核心的工作情况。这些信息可用于自定义电脑监控软件的CPU资源监控功能
523 1
|
机器学习/深度学习 监控 异构计算
如何监控NVIDIA GPU 的运行状态和使用情况
如果这个值很低,则意味着您的 GPU 并没有全速的工作,可能是受到 CPU或者IO 操作的瓶颈,如果你使用的按小时付费的云服务器,那么就是在浪费时间和金钱!
1177 0
如何监控NVIDIA GPU 的运行状态和使用情况
nvidia-smi 启动刷新很慢
nvidia-smi 启动刷新很慢
811 0