嵌入式 linux下利用backtrace追踪函数调用堆栈以及定位段错误

简介:   嵌入式 linux下利用backtrace追踪函数调用堆栈以及定位段错误 2015-05-27 14:19 184人阅读 评论(0) 收藏 举报  分类:   嵌入式(928)  一般察看函数运行时堆栈的方法是使用GDB(bt命令)之类的外部调试器,但是,有些时候为了分析程序的BUG,(主要针对长时间运行程序的分析),在程序出错时打印出函数的调用堆栈是非常有用的。

 

 

嵌入式 linux下利用backtrace追踪函数调用堆栈以及定位段错误

 分类:
 

一般察看函数运行时堆栈的方法是使用GDB(bt命令)之类的外部调试器,但是,有些时候为了分析程序的BUG,(主要针对长时间运行程序的分析),在程序出错时打印出函数的调用堆栈是非常有用的。

在glibc头文件"execinfo.h"中声明了三个函数用于获取当前线程的函数调用堆栈。

 

[cpp]  view plain copy
 
  1. int backtrace(void **buffer,int size)  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">int backtrace(void **buffer,int size)</span>  

该函数用于获取当前线程的调用堆栈,获取的信息将会被存放在buffer中,它是一个指针列表。参数 size 用来指定buffer中可以保存多少个void* 元素。函数返回值是实际获取的指针个数,最大不超过size大小

在buffer中的指针实际是从堆栈中获取的返回地址,每一个堆栈框架有一个返回地址

注意:某些编译器的优化选项对获取正确的调用堆栈有干扰,另外内联函数没有堆栈框架;删除框架指针也会导致无法正确解析堆栈内容

 

[cpp]  view plain copy
 
  1. char ** backtrace_symbols (void *const *buffer, int size)  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">char ** backtrace_symbols (void *const *buffer, int size)</span>  

backtrace_symbols将从backtrace函数获取的信息转化为一个字符串数组. 参数buffer应该是从backtrace函数获取的指针数组,size是该数组中的元素个数(backtrace的返回值)   
   
函数返回值是一个指向字符串数组的指针,它的大小同buffer相同.每个字符串包含了一个相对于buffer中对应元素的可打印信息.它包括函数名,函数的偏移地址,和实际的返回地址

现在,只有使用ELF二进制格式的程序才能获取函数名称和偏移地址.在其他系统,只有16进制的返回地址能被获取.另外,你可能需要传递相应的符号给链接器,以能支持函数名功能(比如,在使用GNU ld链接器的系统中,你需要传递(-rdynamic), -rdynamic可用来通知链接器将所有符号添加到动态符号表中,如果你的链接器支持-rdynamic的话,建议将其加上!)

该函数的返回值是通过malloc函数申请的空间,因此调用者必须使用free函数来释放指针.

注意:如果不能为字符串获取足够的空间函数的返回值将会为NULL

 

[cpp]  view plain copy
 
  1. void backtrace_symbols_fd (void *const *buffer, int size, int fd)  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">void backtrace_symbols_fd (void *const *buffer, int size, int fd)</span>  

backtrace_symbols_fd与backtrace_symbols 函数具有相同的功能,不同的是它不会给调用者返回字符串数组,而是将结果写入文件描述符为fd的文件中,每个函数对应一行.它不需要调用malloc函数,因此适用于有可能调用该函数会失败的情况

 

下面是glibc中的实例(稍有修改):

[cpp]  view plain copy
 
  1. #include <execinfo.h>   
  2. #include <stdio.h>   
  3. #include <stdlib.h>   
  4.   
  5. /* Obtain a backtrace and print it to @code{stdout}. */  
  6. void print_trace (void)  
  7. {  
  8.     void *array[10];  
  9.     size_t size;  
  10.     char **strings;  
  11.     size_t i;  
  12.    
  13.     size = backtrace (array, 10);  
  14.     strings = backtrace_symbols (array, size);  
  15.     if (NULL == strings)  
  16.     {  
  17.         perror("backtrace_synbols");  
  18.         Exit(EXIT_FAILURE);  
  19.     }  
  20.   
  21.     printf ("Obtained %zd stack frames.\n", size);  
  22.   
  23.     for (i = 0; i < size; i++)  
  24.         printf ("%s\n", strings[i]);  
  25.   
  26.     free (strings);  
  27.     strings = NULL;  
  28. }  
  29.   
  30. /* A dummy function to make the backtrace more interesting. */  
  31. void dummy_function (void)  
  32. {  
  33.     print_trace ();  
  34. }  
  35.   
  36. int main (int argc, char *argv[])  
  37. {  
  38.     dummy_function ();  
  39.     return 0;  
  40. }  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">#include <execinfo.h>  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4.   
  5. /* Obtain a backtrace and print it to @code{stdout}. */  
  6. void print_trace (void)  
  7. {  
  8.     void *array[10];  
  9.     size_t size;  
  10.     char **strings;  
  11.     size_t i;  
  12.    
  13.     size = backtrace (array, 10);  
  14.     strings = backtrace_symbols (array, size);  
  15.     if (NULL == strings)  
  16.     {  
  17.         perror("backtrace_synbols");  
  18.         Exit(EXIT_FAILURE);  
  19.     }  
  20.   
  21.     printf ("Obtained %zd stack frames.\n", size);  
  22.   
  23.     for (i = 0; i < size; i++)  
  24.         printf ("%s\n", strings[i]);  
  25.   
  26.     free (strings);  
  27.     strings = NULL;  
  28. }  
  29.   
  30. /* A dummy function to make the backtrace more interesting. */  
  31. void dummy_function (void)  
  32. {  
  33.     print_trace ();  
  34. }  
  35.   
  36. int main (int argc, char *argv[])  
  37. {  
  38.     dummy_function ();  
  39.     return 0;  
  40. }</span>  

输出如下:

[cpp]  view plain copy
 
  1. Obtained 4 stack frames.  
  2. ./execinfo() [0x80484dd]  
  3. ./execinfo() [0x8048549]  
  4. ./execinfo() [0x8048556]  
  5. /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3) [0x70a113]  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">Obtained 4 stack frames.  
  2. ./execinfo() [0x80484dd]  
  3. ./execinfo() [0x8048549]  
  4. ./execinfo() [0x8048556]  
  5. /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3) [0x70a113]  
  6. </span>  


 

我们还可以利用这backtrace来定位段错误位置。

通常情况系,程序发生段错误时系统会发送SIGSEGV信号给程序,缺省处理是退出函数。我们可以使用 signal(SIGSEGV, &your_function);函数来接管SIGSEGV信号的处理,程序在发生段错误后,自动调用我们准备好的函数,从而在那个函数里来获取当前函数调用栈。

举例如下:

[cpp]  view plain copy
 
  1. #include <stdio.h>   
  2. #include <stdlib.h>   
  3. #include <stddef.h>   
  4. #include <execinfo.h>   
  5. #include <signal.h>   
  6.   
  7. void dump(int signo)  
  8. {  
  9.     void *buffer[30] = {0};  
  10.     size_t size;  
  11.     char **strings = NULL;  
  12.     size_t i = 0;  
  13.   
  14.     size = backtrace(buffer, 30);  
  15.     fprintf(stdout, "Obtained %zd stack frames.nm\n", size);  
  16.     strings = backtrace_symbols(buffer, size);  
  17.     if (strings == NULL)  
  18.     {  
  19.         perror("backtrace_symbols.");  
  20.         exit(EXIT_FAILURE);  
  21.     }  
  22.       
  23.     for (i = 0; i < size; i++)  
  24.     {  
  25.         fprintf(stdout, "%s\n", strings[i]);  
  26.     }  
  27.     free(strings);  
  28.     strings = NULL;  
  29.     exit(0);  
  30. }  
  31.   
  32. void func_c()  
  33. {  
  34.     *((volatile char *)0x0) = 0x9999;  
  35. }  
  36.   
  37. void func_b()  
  38. {  
  39.     func_c();  
  40. }  
  41.   
  42. void func_a()  
  43. {  
  44.     func_b();  
  45. }  
  46.   
  47. int main(int argc, const char *argv[])  
  48. {  
  49.     if (signal(SIGSEGV, dump) == SIG_ERR)  
  50.         perror("can't catch SIGSEGV");  
  51.     func_a();  
  52.     return 0;  
  53. }  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">#include <stdio.h>  
  2. #include <stdlib.h>  
  3. #include <stddef.h>  
  4. #include <execinfo.h>  
  5. #include <signal.h>  
  6.   
  7. void dump(int signo)  
  8. {  
  9.     void *buffer[30] = {0};  
  10.     size_t size;  
  11.     char **strings = NULL;  
  12.     size_t i = 0;  
  13.   
  14.     size = backtrace(buffer, 30);  
  15.     fprintf(stdout, "Obtained %zd stack frames.nm\n", size);  
  16.     strings = backtrace_symbols(buffer, size);  
  17.     if (strings == NULL)  
  18.     {  
  19.         perror("backtrace_symbols.");  
  20.         exit(EXIT_FAILURE);  
  21.     }  
  22.       
  23.     for (i = 0; i < size; i++)  
  24.     {  
  25.         fprintf(stdout, "%s\n", strings[i]);  
  26.     }  
  27.     free(strings);  
  28.     strings = NULL;  
  29.     exit(0);  
  30. }  
  31.   
  32. void func_c()  
  33. {  
  34.     *((volatile char *)0x0) = 0x9999;  
  35. }  
  36.   
  37. void func_b()  
  38. {  
  39.     func_c();  
  40. }  
  41.   
  42. void func_a()  
  43. {  
  44.     func_b();  
  45. }  
  46.   
  47. int main(int argc, const char *argv[])  
  48. {  
  49.     if (signal(SIGSEGV, dump) == SIG_ERR)  
  50.         perror("can't catch SIGSEGV");  
  51.     func_a();  
  52.     return 0;  
  53. }</span>  


 

编译程序:

gcc -g -rdynamic test.c -o test; ./test

输出如下:

[cpp]  view plain copy
 
  1. Obtained6stackframes.nm  
  2. ./backstrace_debug(dump+0x45)[0x80487c9]  
  3. [0x468400]  
  4. ./backstrace_debug(func_b+0x8)[0x804888c]  
  5. ./backstrace_debug(func_a+0x8)[0x8048896]  
  6. ./backstrace_debug(main+0x33)[0x80488cb]  
  7. /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3)[0x129113]  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">Obtained6stackframes.nm  
  2. ./backstrace_debug(dump+0x45)[0x80487c9]  
  3. [0x468400]  
  4. ./backstrace_debug(func_b+0x8)[0x804888c]  
  5. ./backstrace_debug(func_a+0x8)[0x8048896]  
  6. ./backstrace_debug(main+0x33)[0x80488cb]  
  7. /lib/i386-linux-gnu/libc.so.6(__libc_start_main+0xf3)[0x129113]</span>  

 (这里有个疑问: 多次运行的结果是/lib/i368-linux-gnu/libc.so.6和[0x468400]的返回地址是变化的,但不变的是后三位, 不知道为什么)

接着:

objdump -d test > test.s

在test.s中搜索804888c如下:

 

[cpp]  view plain copy
 
  1. 8048884 <func_b>:  
  2. 8048884:    55              push %ebp  
  3. 8048885:    89 e5            mov %esp, %ebp  
  4. 8048887:    e8 eb ff ff ff       call 8048877 <func_c>  
  5. 804888c:    5d                pop %ebp  
  6. 804888d:    c3                ret  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">8048884 <func_b>:  
  2. 8048884:    55              push %ebp  
  3. 8048885:    89 e5            mov %esp, %ebp  
  4. 8048887:    e8 eb ff ff ff       call 8048877 <func_c>  
  5. 804888c:    5d                pop %ebp  
  6. 804888d:    c3                ret</span>  

其中80488c时调用(call 8048877)C函数后的地址,虽然并没有直接定位到C函数,通过汇编代码, 基本可以推出是C函数出问题了(pop指令不会导致段错误的)。

我们也可以通过addr2line来查看

[cpp]  view plain copy
 
  1. addr2line 0x804888c -e backstrace_debug -f  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">addr2line 0x804888c -e backstrace_debug -f</span>  

输出:

[cpp]  view plain copy
 
  1. func_b  
  2. /home/astrol/c/backstrace_debug.c:57  
[cpp]  view plain  copy
 
 在CODE上查看代码片派生到我的代码片
  1. <span style="font-size:12px;">func_b  
  2. /home/astrol/c/backstrace_debug.c:57  
  3. </span>  


 

以下是简单的backtrace原理实现:

 

[cpp]  view plain copy
 
  1. #include <stdio.h>   
  2. #include <stdlib.h>   
  3. #include <string.h>   
  4.   
  5. #define LEN 4   
  6. #define FILENAME "stack"   
  7.   
  8. int backtrace(void **buffer, int size)  
  9. {  
  10.     int i = 0;  
  11.     unsigned long int reg_eip = 0;  
  12.     unsigned long int reg_ebp = 0;  
  13.     char cmd[size][64];  
  14.   
  15.     memset(cmd, 0, size * 64);  
  16.     __asm__ volatile (  
  17.         /* get current EBP */  
  18.         "movl %%ebp, %0 \n\t"  
  19.         :"=r"(reg_ebp)  /* output register */  
  20.         :       /* input  register */  
  21.         :"memory"   /* cloberred register */  
  22.     );    
  23.   
  24.     for (i = 0; i < size; i++)  
  25.     {  
  26.         reg_eip = *(unsigned long int *)(reg_ebp + 4);  
  27.         reg_ebp = *(unsigned long int *)(reg_ebp);  
  28.         buffer[i] = (void *)reg_eip;  
  29.         fprintf(stderr, "%p -> ", buffer[i]);  
  30.         sprintf(cmd[i], "addr2line %p -e ", buffer[i]);  
  31.         strncat(cmd[i], FILENAME" -f", strlen(FILENAME)+3);  
  32.         system(cmd[i]);  
  33.         puts("");         
  34.     }  
  35.   
  36.     return size;  
  37. }  
  38.   
  39. static void test2(void)  
  40. {  
  41.     int i = 0;  
  42.     void *buffer[LEN] = {0};  
  43.     backtrace(buffer, LEN);  
  44.     return;  
  45. }  
  46.   
  47. static void test1(void)  
  48. {  
  49.     test2();  
  50. }  
  51.   
  52. static void test(void)  
  53. {  
  54.     test1();  
  55. }  
  56.   
  57. int main(int argc, const char *argv[])  
  58. {  
  59.     test();  
  60.     return 0;  
  61. }  
 
 
目录
相关文章
|
8月前
|
Ubuntu Linux 开发者
Ubuntu20.04搭建嵌入式linux网络加载内核、设备树和根文件系统
使用上述U-Boot命令配置并启动嵌入式设备。如果配置正确,设备将通过TFTP加载内核和设备树,并通过NFS挂载根文件系统。
450 15
|
9月前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
388 13
|
11月前
|
安全 NoSQL Ubuntu
linux 添加用户useradd 段错误 (核心已转储)
在Linux系统中使用`useradd`命令添加用户时遇到“段错误 (核心已转储)”的问题,通常表明存在系统级或关键组件问题。可通过检查系统日志(如`/var/log/syslog`)和内核消息来定位错误。此外,还需检查并修复文件系统错误(使用`fsck`),确保关键配置文件未损坏,并更新系统包与安全补丁。使用内存检测工具(如memtest86+)排查硬件故障,或重新安装`useradd`及其依赖库。通过`strace`跟踪命令执行过程,检查SELinux/AppArmor安全策略影响,并分析核心转储文件以进一步诊断问题根源。
683 1
|
NoSQL Linux C语言
嵌入式GDB调试Linux C程序或交叉编译(开发板)
【8月更文挑战第24天】本文档介绍了如何在嵌入式环境下使用GDB调试Linux C程序及进行交叉编译。调试步骤包括:编译程序时加入`-g`选项以生成调试信息;启动GDB并加载程序;设置断点;运行程序至断点;单步执行代码;查看变量值;继续执行或退出GDB。对于交叉编译,需安装对应架构的交叉编译工具链,配置编译环境,使用工具链编译程序,并将程序传输到开发板进行调试。过程中可能遇到工具链不匹配等问题,需针对性解决。
641 3
|
监控 关系型数据库 MySQL
在Linux中,mysql的innodb如何定位锁问题?
在Linux中,mysql的innodb如何定位锁问题?
|
运维 监控 Linux
Linux系统读写硬盘慢,如何排查?四步教你定位问题!
【8月更文挑战第24天】在Linux系统运维中,硬盘读写速度慢是一个常见且影响重大的问题。它不仅会导致服务器性能下降,还会影响用户体验。本文将详细介绍四个步骤,帮助你快速定位并解决Linux系统硬盘读写慢的问题。
1792 0
|
传感器 人工智能 网络协议
:嵌入式 Linux 及其用途
【8月更文挑战第24天】
494 0
|
关系型数据库 Linux 应用服务中间件
在Linux中,什么是LAMP和LNMP堆栈?
在Linux中,什么是LAMP和LNMP堆栈?
|
机器学习/深度学习 网络协议 安全
在Linux中,如何追踪TCP连接和网络数据包,如使用tcpdump或Wireshark?
在Linux中,如何追踪TCP连接和网络数据包,如使用tcpdump或Wireshark?
|
运维 监控 Java
在Linux中,当遇到系统卡顿时,你会采取哪些步骤来定位原因?
在Linux中,当遇到系统卡顿时,你会采取哪些步骤来定位原因?