段错误(segmentation fault )：9种实用调试方法，你用过几种？ ex 頭條網

段错误(segmentation fault )：9种实用调试方法，你用过几种？

2020-10-14 20:12:13 佚名

引言

每个在Linux环境下工作的程序员，都遇到过段错误（segmentation fault）。所谓段错误，本质上是程序访问了非法内存地址而引起的一种错误类型。

导致程序访问非法地址的原因有很多，如野指针、内存被踩、栈溢出、访问没有权限的内存等。

之前更新调试专题文章时，有朋友问到段错误的调试方法，我承诺会更新文章专门介绍，本文就是来填这个坑的。

本文将介绍9种非常实用的段错误调试方法。

1. 日志

日志是一种非常实用的调试手段，我们可以从系统日志中获得很多非常有用的信息，从而反推问题出现的前后系统中究竟发生了什么异常状况。

printf可能是最简单的日志记录方法，大家都懂的，不再赘述。

2. GDB

GDB的强大无需多言，对于段错误，利用GDB很容易就能定位到触发问题的那一行代码。如下图示例代码：

段错误(segmentation fault )：9种实用调试方法，你用过几种？

编译时加上-g选项：

<code>gcc -g segfault.c -o segfault/<code>

在GDB中运行程序：

段错误触发时，GDB会直接告诉我们问题出现在哪一行代码，并且可以利用backtrace命令查看完整调用栈信息。此外，还可以利用其他常规调试命令来查看参数、变量、内存等数据。

这种方式虽然非常有效，但很多时候，问题并不是100%必现的，我们不可能一直把程序运行在GDB中，这对程序的执行性能等会有很大的影响。

这时，我们可以让程序在异常终止时生成core dump文件，然后用调试工具对它进行离线调试。

3. Core Dump + GDB

Core dump是Linux提供的一种非常实用的程序调试手段，在程序异常终止时，Linux会把程序的上下文信息记录在一个core文件中，然后可以利用GDB等调试工具对core文件进行离线调试。

很多系统中，根据默认配置，程序异常退出时不会产生core dump文件。可以通过下面这条命令查看：

<code>ulimit -c/<code>

如果值是0，则默认不会产生core dump文件。可以用下面命令设置生成core dump文件的大小：

<code>ulimit -c 10240/<code>

上面命令把core dump文件大小设置为10MB。如果存储空间不受限的话，可以直接取消大小限制：

<code>ulimit -c unlimited/<code>

设置core dump文件大小

然后重新运行示例程序，段错误触发后，默认会在当前目录下生产一个core文件：

然后用GDB加载调试core文件。调试时，除了core dump文件外，GDB还需要从可执行文件中加载调试信息。

<code>gdb segfault core/<code>

结果如下图：

GDB调试core dump

与直接在GDB运行程序类似，core dump文件加载起来之后，GDB会直接显示触发问题的那一行代码，也可以使用backtrace、print等常规命令从core dump文件中获取信息。

在大多数系统中，这种core dump + GDB的手段非常有效，而且应该优先考虑使用。

但是有时候，由于某种原因，系统可能无法生存core dump文件。比如出于安全考虑，core dump功能可能是被彻底禁止的，或者在一些存储空间受限的嵌入式系统中，也无法生成core dump文件。

此时，我们就不得不考虑其它的调试手段了。

4. signal capture + backtrace

4.1 段错误在Linux系统上的处理过程

在Linux系统中，程序访问非法地址时，会被CPU捕获后触发硬件异常处理机制，并通知Linux kernel程序运行出现异常，kernel会对各种异常进行区分，然后向应用程序发送不同的signal，由应用程序自己进行故障恢复处理。

对于访问非法地址引起的段错误，Linux kernel会向应用程序发送11号signal，也就是SIGSEGV信号，该信号的默认处理是终止程序运行。

我们可以注册一个信号处理函数，当接受到Linux kernel发送过来的SIGSEGV信号后，在信号处理函数中把当前程序的上下文信息记录下来，方面后续问题定位。

4.2 两个有用的函数

<code>int backtrace(void **buffer, int size);
void backtrace_symbols_fd(void *const *buffer, int size, int fd);/<code>

backtrace获取程序的调用栈地址信息，并存储在buffer指定的一个数组中，数组大小为size。

backtrace_symbols_fd根据backtrace得到的调用栈地址数据，获取地址对应的符号信息，并把结果写到fd指定的文件中。

4.3 示例

对上面的示例做下修改，增加一个信号处理函数，如下图所示：

信号处理函数

在信号处理函数signal_handler中，先把寄存器信息打印出来，然后用backtrace和backtrace_symbols_fd获取调用栈信息，并写入stdout。

然后，在main函数中注册SIGSEGV的信号处理函数，如下图：

注册信号处理函数

编译一下：

<code>gcc -rdynamic segfault.c -o segfault/<code>

看下运行结果：

运行结果

为了方便演示，示例中的信号处理函数只记录了寄存器和调用栈信息，实际项目中根据需求，可以同时记录其它重要信息，如stack dump、全局变量、数据段dump等。

有两点需要注意：

示例信号处理函数中打印寄存器的部分是针对x64 CPU的，其它CPU请参考sys/ucontext.h文件中对mcontext_t的定义。
编译时需要加上-rdynamic选项，否则backtrace_symbols_fd无法正确获取符号信息。

5. signal capture + GDB

有些问题很难重现，直接在GDB里运行调试的话，可能要浪费很多时间去不停的尝试重现它。

那有没有一种方式，可以让问题重现时自动启动GDB呢？当然有！

与上面的一种方法类似，我们仍然利用signal capture的方式。只不过，在信号处理函数中，我们不再使用backtrace获取调用栈信息，而是直接启动GDB：

对信号处理函数作一些修改，如下图：

原理很简单，就是段错误发生时，在SIGSEGV信号处理函数中执行命令：

<code>gdb --pid=xxx -ex bt -q/<code>

启动GDB，并attach到当前进程，然后执行backtrace命令打印调用栈信息。-q选项只是让GDB启动时不要打印版本信息，避免视觉干扰。

编译一下，需要加上-g选项：

<code>gcc -g siggdb.c -o siggdb/<code>

运行，结果如下图：

注意：这种方法只能在测试环境中使用，且要确保GDB可以正常使用。生产环境中不要使用！

6. libSegFault.so

除了上面提到的几种方式外，其实glibc也已经很贴心地提供了一种问题定位的方案：libSegFault.so

libSegFault.so是glibc提供的一个动态链接库，用于捕捉程序运行异常并记录调用栈等调试信息。

它的实现原理和上面提到的第4种方法是一样的，即通过signal capture的方式，程序发生异常时，在信号处理函数中记录调试信息。

使用时，先确定系统中是否存在这个动态链接库。在我的系统中，有这么几个：

根据自己的实际情况，选择一个使用。比如我的测试环境是x64的，我选择使用：

<code>/usr/lib/x86_64-linux-gnu/libSegFault.so/<code>

然后利用环境变量LD_PRELOAD，在测试程序运行前，把libSegFault.so链接进来。

<code>LD_PRELOAD=/usr/lib/debug/lib/x86_64-linux-gnu/libSegFault.so   ./myapp/<code>

仍以本文第一个测试程序为例：

编译：

<code>gcc -rdynamic segfault.c -o segfault/<code>

运行：

<code>LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libSegFault.so ./segfault/<code>

测试程序触发段错误后，libSegFault.so中的信号处理函数会把寄存器、调用栈、内存映射全部dump出来。结果如下图(信息太多，分成了两张图片)：

libSegFault.so运行结果

libSegFault.so运行结果(续)

libSegFault.so默认只捕捉SIGSEGV，可以通过设置环境变量SEGFAULT_SIGNALS指定要捕捉的信号，如：

<code>export SEGFAULT_SIGNALS="all"          # "all" signals
export SEGFAULT_SIGNALS="segv bus abrt "  #SIGSEGV, SIGBUS and SIGABRT/<code>

环境变量SEGFAULT_USE_ALTSTACK可以指定是否让信号处理函数使用独立的栈，这在程序发送栈溢出时会很有用。

<code>export SEGFAULT_USE_ALTSTACK=1/<code>

libSegFault.so默认把调试信息输出到stderr，可以通过设置环境变量SEGFAULT_OUTPUT_NAME，指定调试信息记录到一个文件中。比如：

<code>export SEGFAULT_OUTPUT_NAME="./debug.log"/<code>

此外，为了方便用户使用，很多系统中还提供了一个名为catchsegv的脚本：

<code>catchsegv ./segfault/<code>

其效果与通过LD_PRELOAD加载libSegFault.so是相同的：

7. Valgrind

Valgrind是一个很强大的工具集，它可以检测内存泄露、栈溢出、非法内存访问等多种内存相关的错误，还可以对程序进行性能剖析、生成函数调用关系图、统计Cache命中率、监测多线程竞争等，是程序调试的利器。

Valgrind功能非常强大，但文章篇幅有限，不对其展开讨论，后续会更新文章专门讲解它的各种功能，感兴趣的朋友可以右上角关注一下。

下面演示用Valgrind检测示例程序的内存访问错误：

编译时加上-g选项：

<code>gcc -g segfault.c -o segfault/<code>

然后用Valgrind启动示例程序：

<code>valgrind --tool=memcheck --leak-check=yes -v --leak-check=full --show-reachable=yes ./segfault/<code>

显示数据较多，仅截取感兴趣的部分信息，如下图所示：

Valgrind成功检测出地址0x12345678既不是栈地址，也不是malloc分配的动态内存。并且它也会把调用栈信息dump出来。

Valgrind虽然在检测内存相关的错误时非常强大，但是它有一个致命的缺点，就是慢。据统计，通过Valgrind运行程序时，速度会降低10倍。这在调试大型项目时，尤其是对实时性非常敏感的程序，是无法接受的。

不过，我们还有一个更好的选择 — AddressSanitizer。

8. AddressSanitizer

AddressSanitizer最初是Google开发的一个检测多种内存相关问题的工具，AddressSanitizer现在已经集成到GCC和LLVM中。它最大的特点是：

功能强大。它可以检测内存泄露、访问越界、栈溢出、多次释放等各种内存问题。
快。使用AddressSanitizer检测内存问题时，原始程序运行速度只会降低2倍左右，相比Vagrind来说，运行效率有了很大的提升。

本文只简单演示用AddressSanitizer检测示例程序中的内存访问错误，后续会专门更新文章详细讲解它的各种功能，感兴趣的朋友可以关注一下。

AddressSanitizer的使用方法也非常简单，只需要在编译时加上相应的编译选项，然后正常运行程序即可。

这里，我只使用最简单的一个编译选项-fsanitize=address开启AddressSanitizer功能。

<code>gcc -g -fsanitize=address segfault.c -o segfault/<code>

然后正常运行即可，截图如下图：

9. dmesg + objdump

有时，可能由于各种原因，以上几种方法都不适用，比如程序中无法添加调试信息、程序无法重新编译、没有GDB和Valgrind等调试工具等。

这种情况下，调试起来，会相对比较困难一些，但也并不是完全不可能。

大多数情况下，程序发生segmentation fault而异常退出时，会在系统日志中记录一些信息，可以用dmesg查看：

可以从中得到触发异常的指令地址和被访问的内存地址，然后利用系统中现有的一些工具进行调试，如利用objdump对可执行文件进行反汇编，然后从汇编代码入手进行分析，限于篇幅，不再展开讨论。

Linux下有很多非常有用的工具，如binutils工具集(objdump、nm、readelf等)、strace等，熟悉并善用这些工具，会事半功倍。

结语

本文简单介绍了段错误的常用的9种调试方式，其中很多方法都是值得深入探讨的。

比如signal capture、Valgrind、AddressSanitizer、GDB等，都有很多更为高阶的使用技巧，但限于篇幅，无法展开讲解，后续会更新相关文章进一步深入讲解。

除了文中介绍的9中方法外，还有其它一些相似或衍生的方法，文中并未提及，欢迎童鞋们留言补充，相互学习！

本文是程序调试系列专题的第六篇。本系列专题旨在介绍一些高阶调试技巧、调试器的工作原理以及常见问题的定位方法和思路等内容。

其它已更新内容：

GDB动态打印：让你随时随地printf，不需修改代码，不需重新编译

调试引入的不确定性：必现的BUG神秘消失，断点改变代码执行逻辑

Linux调试技巧：GDB自定义命令，按需定制适合自己的调试工具

C语言：当GDB遇到复杂数据结构，两分钟带你掌握四个高效调试技巧

C语言：GDB调试时遇到宏定义怎么办？一个小技巧帮你一秒钟搞定

若对文中内容有疑问，欢迎留言讨论，对本系列专题有任何建议也欢迎提出！

原创不易，别忘了转发点赞，把知识分享给志同道合的朋友，谢谢！

对编译器、OS内核、性能调优、虚拟化等技术感兴趣的童鞋，欢迎右上角关注！

分享到:

關鍵字: segfault 调试实用

段错误(segmentation fault )：9种实用调试方法，你用过几种？

引言

1. 日志

2. GDB

3. Core Dump + GDB

4. signal capture + backtrace

5. signal capture + GDB

6. libSegFault.so

7. Valgrind

8. AddressSanitizer

9. dmesg + objdump

结语

相關文章:

72小时建成口罩厂 预计产能能达120万只口罩

跑起来了？地铁17、18号线通车倒计时

经开区：流程再造 40多天建起一家口罩厂

激光电视粉丝的"血泪倾诉"，是什么让我前后转变如此之大？

C语言：GDB调试时遇到宏定义怎么办？一个小技巧帮你一秒钟搞定

揭秘恒大“黑灯工厂”：不知疲倦的铁人军团

参与全过程咨询、管理，这里全过程工程咨询项目管理必备

580万元CT机，落户农村乡镇医院，服务乡村，为农民解忧。

苏宁易购2019年报出炉 券商分析师看好全场景发展模式

套娃式收费、被做空！爱奇艺的多事之秋

买星越后悔了！大众迎来“首款”轿跑SUV，2.0T+四驱，气场不输X6

不走寻常路，美特斯邦威业绩暴跌2115%

万达电影一季度亏损5.5-6.5亿；负重之下，不得已拟再募资20亿

万达电影：2019年实现票房98.6亿元 连续11年位列全国第一

会同县检察院依法批捕一涉疫犯罪嫌疑人

双清区：东塔小学开学第一天，疫情防控是重点

世界5大豪车车标，你可能只认识劳斯莱斯，其它4个你都认识吗？

小型养殖户的养殖污水要怎么处理才能达标？

初中化学：溶解度曲线，很多同学都不会此类题目，掌握概念很重要

带女儿再婚有风险，要远离渣男，保持警惕！也可以分段抚养！

花垣县人民法院关于公布失信被执行人名单的公告（2020第2期）

PCL淘汰首日OIG垫底，孤存被舆论攻击，留言太难看了，不忍直视

【高中数学】知识点大全（二）函数与导数，学霸也需要夯实

紫砂文化节，了不起

景雅嘱咐白志勇家里水电煤气，两口子探讨起生活，一对欢喜冤家。

“疫”去春来 平安相聚 隆回县小学全部开学复课

美方有人要求中国为疫情赔偿，耿爽连举三个例子，“有谁让美国赔偿了吗”

宜兴市陶都路发生车祸，两车在斑马线前追尾！

致敬！湖南两名支援湖北专家刚返回湖南不久，又赴哈尔滨指导新冠疫情救治工作

视频分享：万里长城永不倒

新宁警方破获一起利用“某鱼”APP平台诈骗案

“窃格瓦拉”闹剧背后：直播行业的疯狂与焦虑

战机绕台，航母出动！大陆官媒：勿谓言之不预，被视为对台强硬警告，引台战略家猜测！#台湾

祁阳警方严打毒品违法犯罪行为

20款雷克萨斯GX460配置介绍喜欢关注私信

今日头条

20款宾利欧陆GT 喜欢关注私信

19款宝马X6加版3.0T配置喜欢关注私信

相信我，千万不要点开看，不然你会流口水？

19款宾利飞驰v12 详细解说 喜欢关注私信

亦舒《我的前半生》：一部划时代的 "避婚保平安"版渣男图鉴

糖醋带鱼怎么做到香酥无骨，切带鱼和腌制最重要，值得收藏

加拿大计算机系统工程申请条件

14日，外交部发言人赵立坚主持召开例行记者会。驳越南方面主张：西沙群岛、南沙群岛是中国领土。

群体免疫？"德国已经走在这条路上"

确诊突破78万!美国官员:特朗普目光短浅,他让“中国更加伟大”了

美国🇺🇸作为第一大国，为何疫情每天都是几万几万增长？

关于詹姆斯为何无法超越乔丹，杰克船长给出了令人信服的解释

听一曲《长相思》人有生老三千疾，唯有相思不可医

这些明星一生都在做公益 有人倾家荡产有人跑遍全国农村

浅谈:早期游戏技能:活动关注和分享空间！

美国称中国囤积个人防护设备牟取暴利，被我国外交部发言人怒怼

22家券商百亿耗资押注金融科技

连云港板浦派出所所长李紫文：“我就想为老百姓做点事情”

2020中华茶祖节开幕，“中国黄金茶之乡”落户吉首

詹姆斯再次创造历史，成为NBA第一人

般德讲堂丨三偏心蝶阀创新的结构特性赋予了它什么特点？

哈空调第一季度盈利524.53万元同比增长38.44% 销售回款减少

72小时建成口罩厂预计产能能达120万只口罩

苏宁易购2019年报出炉券商分析师看好全场景发展模式

万达电影：2019年实现票房98.6亿元连续11年位列全国第一

“疫”去春来平安相聚隆回县小学全部开学复课

19款宾利飞驰v12 详细解说喜欢关注私信

这些明星一生都在做公益有人倾家荡产有人跑遍全国农村