【发布时间】:2011-09-16 07:04:11
【问题描述】:
我正在 linux 上开发一个应用程序,我想在其中以特定频率回溯所有正在运行的线程。所以我的用户定义的信号处理程序 SIGUSR1(对于所有线程)调用 backtrace()。
我在源自 backtrace() 调用的信号处理程序中遇到崩溃(SIGSEGV)。我已将正确的参数传递给大多数网站上指定的函数。 http://linux.die.net/man/3/backtrace.
在这种情况下,什么会导致 backtrace() 崩溃?
添加更多细节:
是什么让我得出结论,崩溃在回溯内部是下面的第 14 帧。 onMySignal 是信号处理程序 SIGUSR1,它调用回溯。
onMySignal 的示例代码是(复制自 backtrace 的 linux 文档)
pthread_mutex_lock( &sig_mutex );
int j, nptrs;
#define SIZE 100
void *buffer[100] = {NULL};//or void *buffer[100];
char **strings;
nptrs = backtrace(buffer, SIZE);
pthread_mutex_unlock( &sig_mutex );
(gdb) where
#0 0x00000037bac0e9dd in raise () from
#1 0x00002aaabda936b2 in skgesigOSCrash () from
#2 0x00002aaabdd31705 in kpeDbgSignalHandler ()
#3 0x00002aaabda938c2 in skgesig_sigactionHandler ()
#4 <signal handler called>
#5 0x00000037ba030265 in raise () from
#6 0x00000037ba031d10 in abort () from
#7 0x00002b6cef82efd7 in os::abort(bool) () from
#8 0x00002b6cef98205d in VMError::report_and_die() ()
#9 0x00002b6cef835655 in JVM_handle_linux_signal ()
#10 0x00002b6cef831bae in signalHandler(int, siginfo*, void*) ()
#11 <signal handler called>
#12 0x00000037be407638 in ?? ()
#13 0x00000037be4088bb in _Unwind_Backtrace ()
#14 0x00000037ba0e5fa8 in backtrace ()
#15 0x00002aaaaae3875f in onMySignal (signum=10,info=0x4088ec80, context=0x4088eb50)
#16 <signal handler called>
#17 0x00002aaab4aa8acb in mxSession::setPartition(int)
#18 0x0000000000000001 in ?? ()
#19 0x0000000000000000 in ?? ()
(gdb)
希望这会让问题更清楚..
@janneb 我已经在 Mutex 锁中编写了信号处理程序实现,以实现更好的同步。
@janneb 我没有在文档中找到指定 API backtrace_symbols/backtrace 是否为 async_signal_safe。以及它们是否应该在信号处理程序中使用。
我仍然从我的信号处理程序中删除了 backtrace_symbols 并且没有在任何地方使用它。但是我在 backtrace() 中崩溃的实际问题仍然存在。也不知道为什么会崩溃..
23/06/11 编辑:更多细节:
(gdb) where
#0 0x00000037bac0e9dd in raise () from
#1 0x00002aaab98a36b2 in skgesigOSCrash () from
#2 0x00002aaab9b41705 in kpeDbgSignalHandler () from
#3 0x00002aaab98a38c2 in skgesig_sigactionHandler () from
#4 <signal handler called>
#5 0x00000037ba030265 in raise () from
#6 0x00000037ba031d10 in abort () from
#7 0x00002ac003803fd7 in os::abort(bool) () from
#8 0x00002ac00395705d in VMError::report_and_die() () from
#9 0x00002ac00380a655 in JVM_handle_linux_signal () from
#10 0x00002ac003806bae in signalHandler(int, siginfo*, void*) () from
#11 <signal handler called>
#12 0x00000037be407638 in ?? () from libgcc_s.so.1
#13 0x00000037be4088bb in _Unwind_Backtrace () from libgcc_s.so.1
#14 0x00000037ba0e5fa8 in backtrace () from libc.so.6
#15 0x00002aaaaae3875f in onMyBacktrace (signum=10, info=0x415d0eb0, context=0x415d0d80)
#16 <signal handler called>
#17 0x00000037ba071fa8 in _int_free () from libc.so.6
#18 0x00000000000007e0 in ?? ()
#19 0x000000005aab01a0 in ?? ()
#20 0x000000000000006f in ?? ()
#21 0x00000037ba075292 in realloc () from libc.so.6
#22 0x00002aaab6248c4e in Memory::reallocMemory(void*, unsigned long, char const*, int) ()
在执行 realloc 时发生崩溃,其中一个地址类似于 0x00000000000007e0(看起来无效)..
【问题讨论】:
-
你能添加一些代码吗?你确定
backtrace是它崩溃的确切位置吗?但是,使用backtrace,您可以轻松提供导致此问题的无效指针。 -
顺便说一句,您的代码不是异步信号安全的,因为您在信号处理程序中调用 backtrace_symbols()。
-
在信号处理程序中添加互斥体并锁定/解锁它不是解决方案。解决方案是仅在信号处理程序中使用异步信号安全调用。
-
您是否删除了互斥调用?另外,您是否尝试过使用备用信号堆栈?