调试基础知识及原理

简介: 调试基础知识及原理

一个可调试的可执行文件。我个人觉得里面的内容可以分为3个部分。

1,机器码。C/C++ 转成的机器码

2,符号表信息(symbols)

3,调试信息(debug info)

无论是 Linux 的GDB,还是 Windows 的 WinDbg 跟 VsDebug,都是根据上面这些信息来进行调试的。


用前面 ubuntu18 + clion 编译出来的 ffmpeg_g 文件来讲解一下调试器的工作过程。ffmpeg_g 是一个 ELF 文件,用 xelfviewer 打开,如下:

上图是是 ffmpeg_g 里面的符号表,init_options 是里面的一个符号,一个函数就是一个符号。

上图中圈出来的 init_optionsffmpeg_opt.c 里面的一个函数。我编译 ffmpeg_g 的时候 开启了最大的调试信息,所以 symbols 跟 debug info 都有。

下面用 gdb 来调试一下 这个 ffmpeg_g 程序,如下:

gdb ./ffmpeg_g
set args -i walking-dead.mp4 walking-dead.flv -y
b init_options
layout src
r

上图里面,b init_options 就是针对 init_options 这个符号打断点 ,elf 里面必须有符号表才能根据 符号打断点,如果把符号表删了就无法指定符号断点。

然后,这个符号对应的源代码行数,是在 ELF 里面的 debug_xxx 的段表里面的,这是按照 DWAF (Debug With Arbitrary Record Format)标准存储的,如下:

可以使用 nl -l ffmpeg_g 打印符号对应的源代码行数。

ELF 文件生成的时候,符号 跟 源代码的对应关系已经写死了。

例如 init_options 符号就是在 /home/ubuntu/Documents/FFmpeg-n4.4.1/fftools/ffmpeg_opt.c:223 的位置,如果你把源文件目录改了位置,GDB 查询 ELF 的 debug_xxx 段表的时候就会找不到源文件。


因此,文章刚开始提及的 符号表信息(symbols)就是变量名,函数名之类的,调试信息(debug info)是 函数对应的源代码信息。

现在做个测试,我们把 debug info 信息删掉,只保留 symbols ,GDB 调试的时候会有什么特别。

执行以下命令 删除 调试信息:

strip --strip-debug ffmpeg_g

从上图可以看到,删除调试信息之后,文件小了44M。再用 xelfviewer 打开 删除了 debug info 的 ffmpeg_g 文件,可以发现 之前的 debug_info,debug_line 这些段表全都不见了,如下:

现在再次执行以下 gdb 命令调试。

gdb ./ffmpeg_g
set args -i walking-dead.mp4 walking-dead.flv -y
b init_options
layout src
r

从上图可以看到 b init_options 还是可以断点成功,因为我们只是删了调试信息,符号信号还存在,只是 gdb 的提示有变化,只是提示这个函数的地址,之前有调试信息的时候,gdb 会直接提示 ffmpeg_opt.c:223。

这是因为我们把调试信息删了,gdb 找不到这个 init_options 符号对应的源代码信息。

因此,layout src 也会失败,提示没有 源信息,如下:

因此,只能使用汇编调试,执行 layout asm ,切换到汇编界面。

有符号信息的汇编调试,跟无符号信息的汇编调试有什么区别?请看下图:

有调试符号的好处就是,call 那些地址,gdb 都会显示一个函数名给你看,然后 执行 bt 栈回溯的时候,也能显示出来函数名称。

虽然看不到源码,但是能看到函数名,微软经常提供这种符号信息给别人调试,但是不开放debug info 信息跟源码。


现在我再把 符号表也删掉,命令如下:

strip --strip-all ffmpeg_g

从上图可以看出,符号表信息相对较少,只有1M。现在再用 gdb 调试一下 ffmpeg_g,命令如下:

gdb ./ffmpeg_g
set args -i walking-dead.mp4 walking-dead.flv -y

从上图可以看出,init_options 符号已经删掉了,无法根据这个符号进行断点。只保留了一个 main 让你能从入口断一下。使用 bt 回溯的时候,也只能看到一串地址,没有函数名,这时候的 ffmpeg_g 只能看汇编调试,犹如天书。


讲到这里,ffmpeg_g 软件的运行 其实只需要 机器码,符号表信息(symbols)跟 调试信息(debug info)都只是调试需要。

因此我个人把 symbols 看成是初级的调试信息, debug info 是高级调试信息。

因为 debug info 要结合源码来用,所以即使你有debug info,如果没有源码,用处不是很大,但是对于逆向分析,有 debug info 总比没有好。

本文讲的是 Linux 的ELF 调试情况,Windows 的PE 也是类似的。 PE 跟 ELF 事实上同根同源,他们都是由 COFF (Common Object File Format) 格式发展来的。两者都是基于 段的结构。

ELF 相关知识可以看博客文章 《ELF格式简介


参考资料:

1,《软件调试》- 张银奎

2,《Linker and Loader》- John R. Levine

3,《程序员的自我修养 - 链接、装载与库》- 俞甲子,石凡,潘爱民


相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
目录
相关文章
|
6月前
|
程序员 编译器 C语言
编程最重要的技术之一 — 调试(以C语言代码为例)
编程最重要的技术之一 — 调试(以C语言代码为例)
104 0
|
缓存 网络协议 算法
深入浅出Linux内存管理和调试
深入浅出Linux内存管理和调试
|
NoSQL 调度
多线程调试—原理与实践
多线程调试—原理与实践
73 0
|
程序员 C语言
实用调试技巧【下篇】
实用调试技巧【下篇】
84 0
|
程序员 C语言 C++
编程最重要的技术—调试(以C语言代码为例)
编程最重要的技术—调试(以C语言代码为例)
|
程序员
实用调试技巧【上篇】
实用调试技巧【上篇】
102 0
|
编译器 C++ Windows
【VS调试教学】数据结构部分的学习建议:画图 + 写代码 + 调试(二)
❓ 刷题的时候我打死都想不到怎么办? 💡 多刷题!题目刷多了思路就开开阔了,自然就能想到了。 ❓ 我有解题的思路,但是我写代码的时候很困难怎么办? 💡 画图!通过画图可以更好地把思路转换成代码。 ❓ 如何学好数据结构? 多画图,配合着图来写代码,再加上多调试! 画图可以使用Windows自带画图,也可以用笔在草稿纸上画。刚开始的时候不管出没出问题,都建议调试一下的(力扣上要钱,直接使用搬到VS上慢慢调,爽调!)因为调试不仅仅是帮助我们分析程序找到错误的,也可以让我们去观察和理解程序。调试才是硬技能!
172 0
【VS调试教学】数据结构部分的学习建议:画图 + 写代码 + 调试(二)
|
程序员 测试技术 C++
【VS调试教学】数据结构部分的学习建议:画图 + 写代码 + 调试(一)
❓ 刷题的时候我打死都想不到怎么办? 💡 多刷题!题目刷多了思路就开开阔了,自然就能想到了。 ❓ 我有解题的思路,但是我写代码的时候很困难怎么办? 💡 画图!通过画图可以更好地把思路转换成代码。 ❓ 如何学好数据结构? 多画图,配合着图来写代码,再加上多调试! 画图可以使用Windows自带画图,也可以用笔在草稿纸上画。刚开始的时候不管出没出问题,都建议调试一下的(力扣上要钱,直接使用搬到VS上慢慢调,爽调!)因为调试不仅仅是帮助我们分析程序找到错误的,也可以让我们去观察和理解程序。调试才是硬技能!
244 0
【VS调试教学】数据结构部分的学习建议:画图 + 写代码 + 调试(一)
|
网络架构 开发者 ice
3.3基础概念:调试配置介绍|学习笔记
快速学习3.3基础概念:调试配置介绍
3.3基础概念:调试配置介绍|学习笔记
|
开发者 ice
3.4基础概念:常用调试页面简介|学习笔记
快速学习3.4基础概念:常用调试页面简介
3.4基础概念:常用调试页面简介|学习笔记