平头哥玄铁CPU调试系统介绍

简介: 本文将简单介绍CPU的调试系统,并深入描述玄铁CPU的调试系统。

本文作者:傈枫

本文源自:芯片开放社区(OCC)


引言

对于开发人员来说,顺畅的调试系统和高效的调试方法将有效降低开发过程中的信息误差,提升开发效率。本文将介绍玄铁CPU的调试系统组成,分为如下两大部分:

  • 调试系统的基本介绍
  • 玄铁CPU调试系统简介


希望通过本文的介绍,能使用户对玄铁CPU的调试系统有一定的理解、了解玄铁CPU配套的调试工具的使用。同时方便大家更容易理解后续介绍的调试方法。


一 调试系统的基本介绍

图1 典型的MCU调试系统中


调试系统是一套为基于硬件调试模块,结合软件调试工具,为开发者提供解决软硬件bug的技术系统。软件调试部分包括调试工具、link及其固件。硬件调试部分包括调试模块(Debug Module)。


例如图1所示,在典型的MCU调试系统中:

  • 调试工具(Debug Tools)是面向开发者调试的软件工具,一般运行在开发人员的主机、服务器等场景下。常见的有调试工具有GDB、IDE等,如T-HEAD的riscv工具链中的gdb,CDK,DebugServer等工具。开发者使用这类工具进行软件程序的调试、分析工作;
  • 由于调试主机无法直接与CPU上的调试单元连接,因此需要link作为中间转换工具,使得调试工具的操作能够真实地作用在CPU上,比如平头哥的CkLink,Segger的JLink等等;
  • CPU上的调试模块(Debug Module)是支持大部分调试手段的基础,实现对CPU的控制和读写寄存器、读写内存等功能。


二 玄铁CPU调试系统总览

图 2.1 玄铁调试系统概览


如图2.1所示,玄铁CPU调试系统主要由以下几部分组成:

  • 软件运行环境,指软件运行的实际环境,包括模拟器、普通硬件环境(Bare Metal)、基于Linux内核的环境;
  • Debug Monitor,主要指配合调试工具,对被调试程序进行调试控制的工具,包括DebugServer/OpenOCD/GDBServer等。对于实际开发板来说,往往还需要在线仿真调试工具(cable/link),如CkLink, JLink等;
  • 调试/Profiling工具,是开发者经常使用的用于调试程序的工具,主要包括GDB、perf、CPF、Trace、Flash Programmer等;
  • 用户接口,是用户直接接触到的操作界面,主要是命令行工具(CMD Line)、剑池CDK、剑池CDS等。其中大部分调试/profiling工具大部分都支持命令行方式呈现。剑池CDK、剑池CDS相比命令行工具,有友好的界面,具有更好开发体验。


本章节主要介绍玄铁CPU的硬件调试框架,以及部分软件调试工具、Profiling工具的简介。


2.1 玄铁CPU的硬件调试框架

在玄铁CPU的硬件设计上,调试功能集中在调试模块(Debug Module)中基本结构如图2.2所示。基于该架构,调试模块的各个功能可以覆盖各种IOT设备领域的CPU,包括低功耗、音频处理、视频处理、计算型等领域的CPU。

图 2.2 RISC-V调试框架总览


玄铁CPU中的调试模块,是基于《RISC-V Debug Spec v0.13.2》实现的,实现的功能包括:复位及调试控制、寄存器访问、内存访问、断点等功能。


关于调试模块中具体的功能及其操作接口,请查阅《RISC-V Debug Spec v0.13.2》,附链接:https://github.com/riscv/riscv-debug-spec


基本的调试功能介绍:

  • Break-Point功能:Break-Point功能俗称断点功能,即插入断点,使CPU运行到断点位置后停住。开发人员可在断点位置继续进行其他调试手段操作,如读写内存、读写寄存器等。
  • Watch-Point功能:Watch-Point功能是一种对数据访问的调试手段。可以观测某个内存地址是否发生了数据读写行为。
  • 寄存器访问:访问CPU的寄存器能力,包括通用寄存器,控制寄存器等。
  • 内存访问:访问总线上内存以及外设区的能力,可以读写内存上的数据,外设的控制/数据寄存器。
  • 调试控制:指的是单步执行指令、使CPU进入调试模式、全速运行等功能。


2.2 玄铁CPU的软件调试工具

如图2.1所示,玄铁CPU配套有诸多调试工具,本章节将分别介绍几个典型调试工具,如表2.1所示:

表2.1 玄铁调试工具

调试工具 描述
DebugServer 是一种Debug Monitor软件,用于和玄铁CPU的调试模块进行交互,完成调试操作。
GDB 开源GDB软件,支持玄铁CPU体系结构,包括玄铁8系列、9系列CPU
剑池CDK 平头哥推出的玄铁CPU集成开发环境
Perf Perf是Linux上强大的性能分析工具集合。结合PMU事件可对程序热点采样,cycle、指令数统计等。
CPF T-HEAD研发的性能分析工具,能真实反映CPU 的运行轨迹(目前仅在t-head qemu上支持)


2.2.1 DebugServer

DebugServer是平头哥自行设计实现的调试工具。其目的是为了配合GDB完成对CPU的软件调试,其中包含一套GDB Remote Serial Protocol的实现,并解析该协议,通过USB操作link完成协议的执行。同时DebugServer也实现了一套CLI,完成一些简单的调试功能,如复位、指令单步,读写寄存器、读写内存等。


图 2.3 DebugServer Console版本界面


2.2.2 GDB

GDB是一个软件调试工具,是GNU组织维护的开源软件:https://www.gnu.org/software/gdb/。GDB支持不同的后端体系架构,目前GDB的发布的源码版本中已经支持玄铁8系列、9系列CPU。能够满足玄铁CPU的日常开发需求。

通过一段简单示例看一下GDB使用。


图 2.4 RISC-V GDB使用示例


GDB详细手册参考:https://www.gnu.org/software/gdb/documentation/


2.2.3 剑池CDK

剑池CDK是玄铁CPU的开发环境,集成了编辑、编译、调试等功能,便于开发者使用。本章节简要介绍以下CDK的调试功能,如下图所示:


图 2.5 剑池CDK调试界面


截图中基本上涵盖了日常使用到的调试功能:

  • 寄存器读写
  • 反汇编查看
  • 源码对应
  • 断点管理
  • 变量查看
  • 调试控制等


详细调试手册请查看剑池CDK帮助文档


2.2.4 CPF

CPF(C-SKY Profiling analysis utils)是一套针对玄铁CPU应用程序的性能分析工具,包含了一系列记录和分析的工具。CPF基于T-Head trace(目前仅T-Head qemu支持T-Head trace功能)进行分析,通过T-Headtrace 硬件能够非侵入式的获取CPU运行时的信息,真实反映CPU 的运行轨迹。借助于CPF,开发者可以提高开发效率,优化系统设计。

图 2.6 CPF report结果


如图2.6所示,这是一个helloworld的打印输出示例程序,通过CPF工具,可以直观的看出该程序各函数在执行工程中的耗时占比,除此之外,还能看到程序执行的cycle数、指令数,被调用的次数等。


2.2.5 PERF

Perf是一系列强大的性能分析工具集合。在Linux 2.6.31版本引入,至今tool/perf目录拥有1万多个提交,是内核开发中最活跃的几个领域之一,通过perf可以使用一到两行命令就完成像程序热点采样,接口调用分析,阻塞分析。


玄铁CPU的PMU单元支持了大量硬件事件计数器,包含了指令数,周期数,cache访问,分支预测等等,图2.7 以memcpy为例演示perf通过PMU或者程序执行的指令数、周期数。


tst-mem2比tst-mem具有更大的循环拷贝次数。


图 2.7 perf stat –e instructions, cycles tst-mem


关于平头哥玄铁CPU的调试系统介绍就到这里。其他关于玄铁CPU调试系统的文档请参考:


后续我们还将为大家介绍基于玄铁CPU的生态芯片,如何对RISC-V开发板进行调试。

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
相关文章
|
9天前
|
存储 人工智能 vr&ar
转载:【AI系统】CPU 基础
CPU,即中央处理器,是计算机的核心部件,负责执行指令和控制所有组件。本文从CPU的发展史入手,介绍了从ENIAC到现代CPU的演变,重点讲述了冯·诺依曼架构的形成及其对CPU设计的影响。文章还详细解析了CPU的基本构成,包括算术逻辑单元(ALU)、存储单元(MU)和控制单元(CU),以及它们如何协同工作完成指令的取指、解码、执行和写回过程。此外,文章探讨了CPU的局限性及并行处理架构的引入。
转载:【AI系统】CPU 基础
|
9天前
|
人工智能 缓存 并行计算
转载:【AI系统】CPU 计算本质
本文深入探讨了CPU计算性能,分析了算力敏感度及技术趋势对CPU性能的影响。文章通过具体数据和实例,讲解了CPU算力的计算方法、算力与数据加载之间的平衡,以及如何通过算力敏感度分析优化计算系统性能。同时,文章还考察了服务器、GPU和超级计算机等平台的性能发展,揭示了这些变化如何塑造我们对CPU性能的理解和期待。
转载:【AI系统】CPU 计算本质
|
4月前
|
缓存 监控 Linux
在Linux中,如何看当前系统有几颗物理CPU和每颗CPU的核数?
在Linux中,如何看当前系统有几颗物理CPU和每颗CPU的核数?
|
24天前
|
人工智能 缓存 并行计算
【AI系统】CPU 计算本质
本文深入探讨了CPU计算性能,分析了算力敏感度及技术趋势对CPU性能的影响。文章通过具体数据和实例,解释了算力计算方法、数据加载与计算的平衡点,以及如何通过算力敏感度分析优化性能瓶颈。同时,文章还讨论了服务器、GPU和超级计算机等不同计算平台的性能发展趋势,强调了优化数据传输速率和加载策略的重要性。
47 4
|
24天前
|
存储 人工智能 编译器
【AI系统】CPU 指令集架构
本文介绍了指令集架构(ISA)的基本概念,探讨了CISC与RISC两种主要的指令集架构设计思路,分析了它们的优缺点及应用场景。文章还简述了ISA的历史发展,包括x86、ARM、MIPS、Alpha和RISC-V等常见架构的特点。最后,文章讨论了CPU的并行处理架构,如SISD、SIMD、MISD、MIMD和SIMT,并概述了这些架构在服务器、PC及嵌入式领域的应用情况。
53 4
|
24天前
|
存储 人工智能 vr&ar
【AI系统】CPU 基础
CPU,即中央处理器,是计算机的核心组件,负责执行指令和数据计算,协调计算机各部件运作。自1946年ENIAC问世以来,CPU经历了从弱小到强大的发展历程。本文将介绍CPU的基本概念、发展历史及内部结构,探讨世界首个CPU的诞生、冯·诺依曼架构的影响,以及现代CPU的组成与工作原理。从4004到酷睿i系列,Intel与AMD的竞争推动了CPU技术的飞速进步。CPU由算术逻辑单元、存储单元和控制单元三大部分组成,各司其职,共同完成指令的取指、解码、执行和写回过程。
40 3
|
24天前
|
缓存 人工智能 算法
【AI系统】CPU 计算时延
CPU(中央处理器)是计算机系统的核心,其计算时延(从指令发出到完成所需时间)对系统性能至关重要。本文探讨了CPU计算时延的组成,包括指令提取、解码、执行、存储器访问及写回时延,以及影响时延的因素,如时钟频率、流水线技术、并行处理、缓存命中率和内存带宽。通过优化这些方面,可以有效降低计算时延,提升系统性能。文中还通过具体示例解析了时延产生的原因,强调了内存时延对计算速度的关键影响。
42 0
|
2月前
|
运维 JavaScript Linux
容器内的Nodejs应用如何获取宿主机的基础信息-系统、内存、cpu、启动时间,以及一个df -h的坑
本文介绍了如何在Docker容器内的Node.js应用中获取宿主机的基础信息,包括系统信息、内存使用情况、磁盘空间和启动时间等。核心思路是将宿主机的根目录挂载到容器,但需注意权限和安全问题。文章还提到了使用`df -P`替代`df -h`以获得一致性输出,避免解析错误。
|
4月前
|
监控 Linux
性能分析之 Linux 系统中 ps&top 中 CPU 百分比不一致?
【8月更文挑战第18天】性能分析之 Linux 系统中 ps&top 中 CPU 百分比不一致?
215 4
|
4月前
|
数据安全/隐私保护 异构计算 Windows
【Azure 环境】 介绍两种常规的方法来监视Window系统的CPU高时的进程信息: Performance Monitor 和 Powershell Get-Counter
【Azure 环境】 介绍两种常规的方法来监视Window系统的CPU高时的进程信息: Performance Monitor 和 Powershell Get-Counter

热门文章

最新文章

下一篇
DataWorks