【发布时间】:2014-09-22 23:19:31
【问题描述】:
我有两个用于 linux 平台的外包共享库(没有源代码,没有文档)。这些库在单独链接到程序(g++ xx.cpp lib1.so 或 g++ xx.cpp lib2.so)时可以正常工作。
但是,当任何 c++ 程序同时链接到这两个共享库时,程序不可避免地会崩溃并出现“double free”错误(g++ xx.cpp lib1.so lib2.so)。
即使 c++ 程序是 empty hello world 程序并且与这些库无关,它仍然会崩溃。
#include <iostream>
using namespace std;
int main(){
cout<<"haha, I crash again. Catch me if you can"<<endl;
return 0;
}
生成文件:
g++ helloword.cpp lib1.so lib2.so
我得到了一些线索,这些 lib1.so lib2.so 库可能共享一些公共全局变量,并且它们会破坏一些变量两次。我尝试过 gdb 和 valgrind,但无法从回溯中提取有用信息。
有什么方法可以隔离这两个共享库并让它们以沙盒的方式工作?
编辑(添加核心转储和GDB回溯):
我刚刚将前面提到的玩具空helloword程序与两个库(平台:centos 7.0 64bits with gcc4.8.2)链接起来:
g++ helloworld.cpp lib1.so lib2.so -o check
瓦尔格林:
==29953== Invalid free() / delete / delete[] / realloc()
==29953== at 0x4C29991: operator delete(void*) (in /usr/lib64/valgrind/vgpreload_memcheck-amd64-linux.so)
==29953== by 0x613E589: __cxa_finalize (in /usr/lib64/libc-2.17.so)
==29953== by 0x549B725: ??? (in /home/fanbin/InventoryManagment/lib1.so)
==29953== by 0x5551720: ??? (in /home/fanbin/InventoryManagment/lib1.so)
==29953== by 0x613E218: __run_exit_handlers (in /usr/lib64/libc-2.17.so)
==29953== by 0x613E264: exit (in /usr/lib64/libc-2.17.so)
==29953== by 0x6126AFB: (below main) (in /usr/lib64/libc-2.17.so)
==29953== Address 0x6afb780 is 0 bytes inside a block of size 624 free'd
==29953== at 0x4C29991: operator delete(void*) (in /usr/lib64/valgrind/vgpreload_memcheck-amd64-linux.so)
==29953== by 0x613E589: __cxa_finalize (in /usr/lib64/libc-2.17.so)
==29953== by 0x4F07AC5: ??? (in /home/fanbin/InventoryManagment/lib2.so)
==29953== by 0x5039900: ??? (in /home/fanbin/InventoryManagment/lib2.so)
==29953== by 0x613E218: __run_exit_handlers (in /usr/lib64/libc-2.17.so)
==29953== by 0x613E264: exit (in /usr/lib64/libc-2.17.so)
==29953== by 0x6126AFB: (below main) (in /usr/lib64/libc-2.17.so)
gdb 回溯消息:
(gdb) bt
#0 0x00007ffff677d989 in raise () from /lib64/libc.so.6
#1 0x00007ffff677f098 in abort () from /lib64/libc.so.6
#2 0x00007ffff67be197 in __libc_message () from /lib64/libc.so.6
#3 0x00007ffff67c556d in _int_free () from /lib64/libc.so.6
#4 0x00007ffff7414aa2 in __tcf_0 () from ./lib1.so
#5 0x00007ffff678158a in __cxa_finalize () from /lib64/libc.so.6
#6 0x00007ffff739f726 in __do_global_dtors_aux () from ./lib1.so
#7 0x0000000000600dc8 in __init_array_start ()
#8 0x00007fffffffe2c0 in ?? ()
#9 0x00007ffff7455721 in _fini () from ./lib1.so
#10 0x00007fffffffe2c0 in ?? ()
#11 0x00007ffff7debb98 in _dl_fini () from /lib64/ld-linux-x86-64.so.2
Backtrace stopped: previous frame inner to this frame (corrupt stack?)
更新
感谢@RaduCivu 的帮助,我发现了一个非常相似的场景:segmentation fault at __tcf_0 when program exits,看起来两个库之间确实存在全局变量冲突。考虑到我没有这两个外部共享库的源文件,除了使用两个单独的进程,还有其他方法可以解决这个冲突吗?
【问题讨论】:
-
什么是#char全部? span>
-
在我看来这两个库是用不同版本的 gcc(或任何情况下的不同编译器)编译的,在这种情况下你无能为力,除了与开发人员交谈以使用相同的编译器或 make通过 IPC 通信的独立进程
-
@ nirmh“#”只表示共享库的名称。我进行了编辑以使其更具可读性。
-
只有当它是链接器在编译时找不到的全局变量,因此系统从另一个 .so (extern void* globalVar) 加载它时,你才能使用 gdb 获取堆栈跟踪和将其发布在您的问题中?也许我们可以从那里得到更多的上下文
-
是的,所以问题就像你说的两个全局变量之间的名称冲突,更多关于这个的链接:stackoverflow.com/questions/6828984/crash-in-tcf-0
标签: c++ linux crash shared-libraries double-free