【问题标题】:Is it possible for an LD_PRELOAD to only affect the main executable?LD_PRELOAD 是否可能只影响主可执行文件?
【发布时间】:2021-08-28 21:00:18
【问题描述】:

实际问题

我有一个默认情况下使用 EGL 和 SDL 1.2 分别处理图形和用户输入的可执行文件。使用LD_PRELOAD,我已将两者都替换为 GLFW。

除非用户安装了依赖于 EGL 本身的 Wayland 版本的 GLFW,否则这将正常工作。因为所有的 EGL 调用要么被存根不做任何事情,要么调用 GLFW 等效项,所以它不起作用(即 eglSwapBuffers 调用 glfwSwapBuffers 调用 eglSwapBuffers 等等)。我无法删除 EGL 存根,因为它会同时调用 EGL 和 GLFW,并且主可执行文件是封闭源代码,因此我无法对其进行修改。

有什么方法可以让LD_PRELOAD 影响主可执行文件但不影响 GLFW?或者任何其他解决方案可以获得相同的效果?

简化问题

我做了一个简化的例子来演示这个问题。

主要可执行文件:

#include <stdio.h>

extern void do_something();

int main() {
    do_something();
    fputs("testing B\n", stderr);
}

共享库:

#include <stdio.h>

void do_something() {
    fputs("testing A\n", stderr);
}

预加载库:

#include <stdio.h>

int fputs(const char *str, FILE *file) {
    // Do Nothing
    return 0;
}

不使用预加载的库时,输出为:

testing A
testing B

使用时,输出什么都没有。

我正在寻找一种方法使预加载的库只影响主可执行文件,输出将是:

testing A

谢谢!

【问题讨论】:

  • 我假设你的意思是你希望输出只是testing A,而不是testing B

标签: c linux dynamic-linking ld-preload


【解决方案1】:

您可以检查返回地址是否在可执行文件或库中,然后调用“真实”函数或执行存根代码,如下所示:

#define _GNU_SOURCE

#include <dlfcn.h>
#include <link.h>
#include <stdio.h>
#include <stdlib.h>

static struct {
    ElfW(Addr) start, end;
} *segments;
static int n;
static int (*real_fputs)(const char *, FILE *);

static int callback(struct dl_phdr_info *info, size_t size, void *data) {
    n = info->dlpi_phnum;
    segments = malloc(n * sizeof *segments);
    for(int i = 0; i < n; ++i) {
        segments[i].start = info->dlpi_addr + info->dlpi_phdr[i].p_vaddr;
        segments[i].end = info->dlpi_addr + info->dlpi_phdr[i].p_vaddr + info->dlpi_phdr[i].p_memsz;
    }
    return 1;
}

__attribute__((__constructor__))
static void setup(void) {
    real_fputs = dlsym(RTLD_NEXT, "fputs");
    dl_iterate_phdr(callback, NULL);
}

__attribute__((__destructor__))
static void teardown(void) {
    free(segments);
}

__attribute__((__noinline__))
int fputs(const char *str, FILE *file) {
    ElfW(Addr) addr = (ElfW(Addr))__builtin_extract_return_addr(__builtin_return_address(0));
    for(int i = 0; i < n; ++i) {
        if(addr >= segments[i].start && addr < segments[i].end) {
            // Do Nothing
            return 0;
        }
    }
    return real_fputs(str, file);
}

不过,这有一些警告。例如,如果您的可执行文件调用了一个库函数,该库函数尾部调用了您正在挂钩的函数,那么这将错误地认为该库调用是一个可执行调用。 (您也可以通过为这些库函数添加包装器来缓解这个问题,无条件地转发到“真实”函数,并使用-fno-optimize-sibling-calls 编译包装器代码。)此外,没有办法区分匿名可执行内存(例如, JITted 代码)最初来自可执行文件或库。

要对此进行测试,请将我的代码保存为hook_fputs.c,将您的主要可执行文件保存为main.c,并将您的共享库保存为libfoo.c。然后运行这些命令:

clang -fPIC -shared hook_fputs.c -ldl -o hook_fputs.so
clang -fPIC -shared libfoo.c -o libfoo.so
clang main.c ./libfoo.so
LD_PRELOAD=./hook_fputs.so ./a.out

【讨论】:

    【解决方案2】:

    针对这两种情况分别实现插入库。

    创建一个使用ldd 的包装脚本或程序,以找出与目标二进制文件动态链接的确切 EGL 库版本及其路径;然后,在 GLFW 库上使用 ldd 来确定它是否与 EGL 链接。最后,让它使用LD_PRELOAD 环境变量中的适当插入库的路径执行目标二进制文件。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多