【发布时间】:2011-02-22 00:17:09
【问题描述】:
如何确定导致segmentation fault 的代码中的错误在哪里?
我的编译器 (gcc) 可以显示程序中故障的位置吗?
【问题讨论】:
-
没有 gcc/gdb 不能。您可以找出 哪里 发生段错误,但实际错误可能在完全不同的位置。
标签: c++ c debugging segmentation-fault
如何确定导致segmentation fault 的代码中的错误在哪里?
我的编译器 (gcc) 可以显示程序中故障的位置吗?
【问题讨论】:
标签: c++ c debugging segmentation-fault
【讨论】:
bt 作为backtrace 的简写。
您也可以使用核心转储,然后使用 gdb 对其进行检查。要获得有用的信息,您还需要使用-g 标志进行编译。
每当您收到消息时:
Segmentation fault (core dumped)
一个核心文件被写入您的当前目录。你可以用命令检查它
gdb your_program core_file
该文件包含程序崩溃时的内存状态。在部署软件期间,核心转储可能很有用。
确保您的系统没有将核心转储文件大小设置为零。您可以将其设置为无限制:
ulimit -c unlimited
不过要小心!核心转储可能会变得巨大。
【讨论】:
gdb --core=core。
ulimit -c查看当前状态,查看更多使用ulimit -a。
Lucas 关于核心转储的回答很好。在我的 .cshrc 我有:
alias core 'ls -lt core; echo where | gdb -core=core -silent; echo "\n"'
通过输入'core'来显示回溯。还有日期戳,以确保我正在查看正确的文件:(。
添加:如果存在堆栈损坏错误,则应用于核心转储的回溯通常是垃圾。在这种情况下,根据接受的答案,在 gdb 中运行程序可以获得更好的结果(假设故障很容易重现)。还要注意多个进程同时转储核心;某些操作系统会将 PID 添加到核心文件的名称中。
【讨论】:
ulimit -c unlimited首先启用核心转储。
另外,你可以试试valgrind:如果你安装valgrind并运行
valgrind --leak-check=full <program>
然后它将运行您的程序并显示任何段错误的堆栈跟踪,以及任何无效的内存读取或写入和内存泄漏。真的很好用。
【讨论】:
--leak-check=full 将无助于调试段错误。它仅对调试内存泄漏有用。
有许多工具可以帮助调试分段错误,我想将我最喜欢的工具添加到列表中:Address Sanitizers(通常缩写为 ASAN)。
现代¹ 编译器带有方便的 -fsanitize=address 标志,增加了一些编译时间和运行时间开销,从而进行更多的错误检查。
根据the documentation,这些检查包括默认捕获分段错误。此处的优点是您获得了类似于 gdb 输出的堆栈跟踪,但无需在调试器中运行程序。一个例子:
int main() {
volatile int *ptr = (int*)0;
*ptr = 0;
}
$ gcc -g -fsanitize=address main.c
$ ./a.out
AddressSanitizer:DEADLYSIGNAL
=================================================================
==4848==ERROR: AddressSanitizer: SEGV on unknown address 0x000000000000 (pc 0x5654348db1a0 bp 0x7ffc05e39240 sp 0x7ffc05e39230 T0)
==4848==The signal is caused by a WRITE memory access.
==4848==Hint: address points to the zero page.
#0 0x5654348db19f in main /tmp/tmp.s3gwjqb8zT/main.c:3
#1 0x7f0e5a052b6a in __libc_start_main (/lib/x86_64-linux-gnu/libc.so.6+0x26b6a)
#2 0x5654348db099 in _start (/tmp/tmp.s3gwjqb8zT/a.out+0x1099)
AddressSanitizer can not provide additional info.
SUMMARY: AddressSanitizer: SEGV /tmp/tmp.s3gwjqb8zT/main.c:3 in main
==4848==ABORTING
输出比 gdb 的输出稍微复杂一些,但也有好处:
无需重现问题即可接收堆栈跟踪。只需在开发过程中启用标志就足够了。
ASAN 捕获的不仅仅是分段错误。即使进程可以访问该内存区域,也会捕获许多越界访问。
¹ 那是Clang 3.1+ 和GCC 4.8+。
【讨论】:
以上所有答案均正确且值得推荐;如果上述方法均不可用,则此答案仅作为最后的手段。
如果所有其他方法都失败了,您始终可以使用各种临时调试打印语句(例如fprintf(stderr, "CHECKPOINT REACHED @ %s:%i\n", __FILE__, __LINE__);)重新编译您的程序,这些语句散布在您认为是代码的相关部分的各处。然后运行程序,并观察在崩溃发生之前最后打印的调试打印内容——你知道你的程序已经走到了那一步,所以崩溃一定是在那之后发生的。添加或删除调试打印,重新编译并再次运行测试,直到您将其缩小到一行代码。此时您可以修复错误并删除所有临时调试打印。
这很乏味,但它的优势在于几乎可以在任何地方工作——唯一的可能是如果您由于某种原因无法访问 stdout 或 stderr,或者您正在尝试修复的错误是一种竞争条件,其行为会随着程序时间的变化而变化(因为调试打印会减慢程序并改变其时间)
【讨论】: