【发布时间】:2012-05-08 05:40:04
【问题描述】:
如果我使用 GCC 编译器在 C++ 中有库 A、B 和 C。 Lib A 和 B 都依赖于 C,但依赖于它的不同版本。然后我可以在另一个程序中同时使用 A 和 B 吗?或者 A 和 B 要求的 C 的不同版本会冲突吗?我该如何解决这个问题,我可以吗?
【问题讨论】:
标签: c++ gcc dependencies
如果我使用 GCC 编译器在 C++ 中有库 A、B 和 C。 Lib A 和 B 都依赖于 C,但依赖于它的不同版本。然后我可以在另一个程序中同时使用 A 和 B 吗?或者 A 和 B 要求的 C 的不同版本会冲突吗?我该如何解决这个问题,我可以吗?
【问题讨论】:
标签: c++ gcc dependencies
动态库不做强大的版本检查,这意味着如果 A 在 C 中使用的入口点没有改变,那么它仍然可以使用更高版本的 C。话虽如此,Linux 发行版通常使用提供版本支持的符号链接文件系统方法。这意味着如果一个可执行文件被设计为仅与 1.2.2 一起使用,那么它可以专门链接到查找/usr/lib/mylib-1.2.2。
大多数程序都链接到查找一般情况,例如。 /usr/lib/mylib 这将象征性地链接到机器上的版本。例如。 /usr/lib/mylib -> /usr/lib/mylib-1.2.2。如果您不链接到特定版本并且实际接口不更改,那么向前兼容性应该不是问题。
如果要检查库 A 和 B 是否绑定到特定命名的 C 版本,可以在它们上使用 ldd 命令检查 dll 搜索路径。
【讨论】:
我假设您正在动态链接。如果 A 和 B 都完全封装了它们各自版本的 C,那么就有可能做到这一点。您可能必须确保不同版本的 C 命名不同(即 libMyC.1.so 和 libMyC.2.so)以避免在运行时加载它们时造成混淆。
您还可以调查静态构建 A 和 B 以避免运行时负载混淆的可能性。
找出答案的最简单方法就是尝试一下。应该不会花很长时间来确定它是否会起作用。
最后,当然,到目前为止,最简单的解决方案,从维护的角度来看也是最好的,是将 A 或 B 提升到另一个级别,以便它们都使用相同版本的 C。这在有这么多方法,我强烈建议你这样做,而不是尝试解决一个真正的问题。
【讨论】:
我在寻找答案时发现了这个问题,正如@Component-10 所建议的,我创建了一组最小的文件来调查这种行为并使用 MacOS + CLANG 进行了测试。
编辑
正如 cmets 中所指出的,共享库方法不是跨平台的,在 Linux 中不起作用。
@SergA 使用动态加载库 (dl) API (https://www.dwheeler.com/program-library/Program-Library-HOWTO/x172.html) 创建了一个解决方案。
#include <stdio.h>
#include <stdlib.h>
#include <dlfcn.h>
// #define DLOPEN_FLAGS RTLD_LAZY | RTLD_LOCAL
#define DLOPEN_FLAGS RTLD_LAZY
#if defined(_WIN32) || defined(__CYGWIN__)
// Windows (x86 or x64)
const char* libA = "libA.shared.dll";
const char* libB = "libB.shared.dll";
#elif defined(__linux__)
// Linux
const char* libA = "libA.shared.so";
const char* libB = "libB.shared.so";
#elif defined(__APPLE__) && defined(__MACH__)
// Mac OS
const char* libA = "libA.shared.dylib";
const char* libB = "libB.shared.dylib";
#elif defined(unix) || defined(__unix__) || defined(__unix)
// Unix like OS
const char* libA = "libA.shared.so";
const char* libB = "libB.shared.so";
#else
#error Unknown environment!
#endif
int main(int argc, char **argv)
{
(void)argc;
(void)argv;
void *handle_A;
void *handle_B;
int (*call_A)(void);
int (*call_B)(void);
char *error;
handle_B = dlopen(libB, DLOPEN_FLAGS);
if(handle_B == NULL) {
fprintf(stderr, "%s\n", dlerror());
exit(EXIT_FAILURE);
}
handle_A = dlopen(libA, DLOPEN_FLAGS);
if(handle_A == NULL) {
fprintf(stderr, "%s\n", dlerror());
exit(EXIT_FAILURE);
}
call_A = dlsym(handle_A, "call_A");
error = dlerror();
if(error != NULL) {
fprintf(stderr, "%s\n", error);
exit(EXIT_FAILURE);
}
call_B = dlsym(handle_B, "call_B");
error = dlerror();
if(error != NULL) {
fprintf(stderr, "%s\n", error);
exit(EXIT_FAILURE);
}
printf(" main_AB->");
call_A();
printf(" main_AB->");
call_B();
dlclose(handle_B);
dlclose(handle_A);
return 0;
}
这是我的文件集。为简洁起见,我不会在这里全部展示。
$ tree .
.
├── A
│ ├── A.cc
│ └── A.hh
├── B
│ ├── B.cc
│ └── B.hh
├── C
│ ├── v1
│ │ ├── C.cc
│ │ └── C.hh
│ └── v2
│ ├── C.cc
│ └── C.hh
├── compile_shared_works.sh
├── compile_static_fails.sh
├── main_A.cc
├── main_AB.cc
└── main_B.cc
A 依赖于 C 版本 1,B 依赖于 C 版本 2。每个库都包含一个函数,例如libA 包含调用libC v1 的call_C 的call_A,而libB 包含调用libC v1 的call_C 的call_B。
然后main_A 只链接到libA,main_B 只链接到lib_B,main_AB 链接到两者。
以下命令集静态构建libA 和libB。
#clean slate
rm -f *.o *.so *.a *.exe
#generate static libA
g++ -I . -c C/v1/C.cc A/A.cc
ar rvs libA.a *.o
rm -f *.o
#generate static libB
g++ -I . -c C/v2/C.cc B/B.cc
ar rvs libB.a *.o
rm -f *.o
#generate 3 versions of exe
g++ -L . -lA main_A.cc -o main_A.exe
g++ -L . -lB main_B.cc -o main_B.exe
g++ -L . -lA -lB main_AB.cc -o main_AB.exe
./main_A.exe
./main_B.exe
./main_AB.exe
输出是
main_A->call_A->call_C [v1]
main_B->call_B->call_C [v2]
main_AB->call_A->call_C [v1]
main_AB->call_B->call_C [v1]
当main_AB 执行call_B 时,它会走错地方!
#clean slate
rm -f *.o *.so *.a *.exe
#generate shared libA
g++ -I . -c -fPIC C/v1/C.cc A/A.cc
g++ -shared *.o -o libA.so
rm *.o
#generate shared libB
g++ -I . -c -fPIC C/v2/C.cc B/B.cc
g++ -shared *.o -o libB.so
rm *.o
#generate 3 versions of exe
g++ -L . -lA main_A.cc -o main_A.exe
g++ -L . -lB main_B.cc -o main_B.exe
g++ -L . -lA -lB main_AB.cc -o main_AB.exe
./main_A.exe
./main_B.exe
./main_AB.exe
输出是
main_A->call_A->call_C [v1]
main_B->call_B->call_C [v2]
main_AB->call_A->call_C [v1]
main_AB->call_B->call_C [v2]
它可以工作(在 MacOS 上)!
【讨论】:
-fvisibility=hidden 或通过代码注释 __attribute__((visibility("hidden"))) 直接在 libC 中指定可见性。
@SergA 的解决方案也适用于 Linux,如果我们使用标志打开共享库
RTLD_LAZY | RTLD_LOCAL
输出是:
1. Main_AB_dlopen -> CallA -> callC(v1)
2. Main_AB_dlopen -> callB -> callC(v2)
【讨论】:
dlopen(RTLD_LOCAL | RTLD_DEEPBIND)我有一个解决方案
或dlmopen(LM_ID_NEWLM, "filename.so", ...)
(和上面其他答案一样熟悉)
首先我们应该阅读这篇文章来了解 .dynsym 是 linux ELF 中的“导出符号表”:https://blogs.oracle.com/solaris/post/inside-elf-symbol-tables
每个elf文件都包含可执行文件和动态库,头文件中有.dynsym。以__attribute__((visibility("default"))) 声明的函数将记录在此标头区域中。
但是如果-fvisibility=hidden没有分配给编译器(gcc),所有的函数都会被编译器自动声明为__attribute__((visibility("default")))。 (所有功能都标记为导出)
所有的.so会在程序启动之前被加载到内存中int main(),所有文件在ELF头中被一一标记为DT_NEEDED。
当前程序在系统中有一个全局符号表,所有的.so文件都加载并填入该表中所持有的函数名的地址,如果两个.so文件有相同的函数名,只有第一个会接受的。
dlopen()
dlopen()中加载的程序与ELF头加载没有区别,全局符号表也由dlopen()填充。
例如
// main.cpp
__attribute__((visibility("default"))) int fn() { return 10; }
void print();
int main() { print(); return 0; }
// libfn.cpp => libfn.so
__attribute__((visibility("default"))) int fn() { return 999; }
__attribute__((visibility("default"))) void print() { cout<<fn(); }
10 会打印,因为 main.cpp 中的 fn() 会在 libfn.so 之前加载。
如果使用dlopen(libfn.so, RTLD_LOCAL)而不使用RTLD_DEEPBIND,数字10仍然会被打印出来。
如果在编译阶段使用普通链接,即使使用lib_try_in_middle.so之类的东西来分隔ELF-header中的.dynsym,any文件中的函数标记为__attribute__((visibility("default"))) 总是出现在全局符号表中。
address sanitizer 无法与 RTLD_DEEPBIND 一起使用,我还没有找到任何解决方案让 asan 在 dlmopen() 的新命名空间中运行。
【讨论】: