当您在标志中使用sigaction() 和SA_SIGINFO 安装信号处理程序时,信号处理程序获得的第二个参数是指向siginfo_t 的指针,第三个参数是指向ucontext_t 的指针。在 Linux 中,这个结构体包含内核中断线程时寄存器值的集合,包括程序计数器。
#define _POSIX_C_SOURCE 200809L
#define _GNU_SOURCE
#include <signal.h>
#include <ucontext.h>
#if defined(__x86_64__)
#define PROGCOUNTER(ctx) (((ucontext *)ctx)->uc_mcontext.greg[REG_RIP])
#elif defined(__i386__)
#define PROGCOUNTER(ctx) (((ucontext *)ctx)->uc_mcontext.greg[REG_EIP])
#else
#error Unsupported architecture.
#endif
void signal_handler(int signum, siginfo_t *info, void *context)
{
const size_t program_counter = PROGCOUNTER(context);
/* Do something ... */
}
像往常一样,printf() 等。不是异步信号安全,这意味着在信号处理程序中使用它们是不安全的。如果您希望将程序计数器输出到例如标准错误,你不应该使用任何标准 I/O 来打印到stderr,而是手动构造要打印的字符串,并使用循环到write() 字符串的内容;例如,
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
static void wrerr(const char *p)
{
const int saved_errno = errno;
const char *q = p;
ssize_t n;
/* Nothing to print? */
if (!p || !*p)
return;
/* Find end of q. strlen() is not async-signal safe. */
while (*q) q++;
/* Write data from p to q. */
while (p < q) {
n = write(STDERR_FILENO, p, (size_t)(q - p));
if (n > 0)
p += n;
else
if (n != -1 || errno != EINTR)
break;
}
errno = saved_errno;
}
请注意,您需要在信号处理程序中保持errno 的值不变,这样如果在库函数失败后被中断,被中断的线程仍然会看到正确的errno 值。 (这主要是一个调试问题,并且是“良好的形式”;一些白痴对此嗤之以鼻,因为“它发生的频率不足以让我担心”。)
您的程序可以检查/proc/self/maps 伪文件(它不是真正的文件,而是内核在读取文件时动态生成的东西)以查看程序使用的内存区域,以确定程序是否传递中断时正在运行 C 库函数(非常常见)或其他东西。
如果您想中断多线程程序中的特定线程,只需使用pthread_kill()。否则,信号将被传递给未阻塞信号的线程之一,或多或少是随机的。
这是一个示例程序,在 x86-64 (AMD64) 和 x86 中测试,使用 GCC-4.8.4 使用 -Wall -O2 编译:
#define _POSIX_C_SOURCE 200809L
#define _GNU_SOURCE
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <errno.h>
#include <signal.h>
#include <ucontext.h>
#include <time.h>
#include <stdio.h>
#if defined(__x86_64__)
#define PROGRAM_COUNTER(mctx) ((mctx).gregs[REG_RIP])
#define STACK_POINTER(mctx) ((mctx).gregs[REG_RSP])
#elif defined(__i386__)
#define PROGRAM_COUNTER(mctx) ((mctx).gregs[REG_EIP])
#define STACK_POINTER(mctx) ((mctx).gregs[REG_ESP])
#else
#error Unsupported hardware architecture.
#endif
#define MAX_SIGNALS 64
#define MCTX(ctx) (((ucontext_t *)ctx)->uc_mcontext)
static void wrerr(const char *p, const char *q)
{
while (p < q) {
ssize_t n = write(STDERR_FILENO, p, (size_t)(q - p));
if (n > 0)
p += n;
else
if (n != -1 || errno != EINTR)
break;
}
}
static const char hexc[16] = "0123456789abcdef";
static inline char *prehex(char *before, size_t value)
{
do {
*(--before) = hexc[value & 15];
value /= (size_t)16;
} while (value);
*(--before) = 'x';
*(--before) = '0';
return before;
}
static volatile sig_atomic_t done = 0;
static void handle_done(int signum)
{
done = signum;
}
static int install_done(const int signum)
{
struct sigaction act;
memset(&act, 0, sizeof act);
sigemptyset(&act.sa_mask);
act.sa_handler = handle_done;
act.sa_flags = 0;
if (sigaction(signum, &act, NULL) == -1)
return errno;
return 0;
}
static size_t jump_target[MAX_SIGNALS] = { 0 };
static size_t jump_stack[MAX_SIGNALS] = { 0 };
static void handle_jump(int signum, siginfo_t *info, void *context)
{
const int saved_errno = errno;
char buffer[128];
char *p = buffer + sizeof buffer;
*(--p) = '\n';
p = prehex(p, STACK_POINTER(MCTX(context)));
*(--p) = ' ';
*(--p) = 'k';
*(--p) = 'c';
*(--p) = 'a';
*(--p) = 't';
*(--p) = 's';
*(--p) = ' ';
*(--p) = ',';
p = prehex(p, PROGRAM_COUNTER(MCTX(context)));
*(--p) = ' ';
*(--p) = '@';
wrerr(p, buffer + sizeof buffer);
if (signum >= 0 && signum < MAX_SIGNALS) {
if (jump_target[signum])
PROGRAM_COUNTER(MCTX(context)) = jump_target[signum];
if (jump_stack[signum])
STACK_POINTER(MCTX(context)) = jump_stack[signum];
}
errno = saved_errno;
}
static int install_jump(const int signum, void *target, size_t stack)
{
struct sigaction act;
if (signum < 0 || signum >= MAX_SIGNALS)
return errno = EINVAL;
jump_target[signum] = (size_t)target;
jump_stack[signum] = (size_t)stack;
memset(&act, 0, sizeof act);
sigemptyset(&act.sa_mask);
act.sa_sigaction = handle_jump;
act.sa_flags = SA_SIGINFO;
if (sigaction(signum, &act, NULL) == -1)
return errno;
return 0;
}
int main(int argc, char *argv[])
{
const struct timespec sec = { .tv_sec = 1, .tv_nsec = 0L };
const int pid = (int)getpid();
ucontext_t ctx;
printf("Run\n");
printf("\tkill -KILL %d\n", pid);
printf("\tkill -TERM %d\n", pid);
printf("\tkill -HUP %d\n", pid);
printf("\tkill -INT %d\n", pid);
printf("or press Ctrl+C to stop this process, or\n");
printf("\tkill -USR1 %d\n", pid);
printf("\tkill -USR2 %d\n", pid);
printf("to send the respective signal to this process.\n");
fflush(stdout);
if (install_done(SIGTERM) ||
install_done(SIGHUP) ||
install_done(SIGINT) ) {
printf("Cannot install signal handlers: %s.\n", strerror(errno));
return EXIT_FAILURE;
}
getcontext(&ctx);
if (install_jump(SIGUSR1, &&usr1_target, STACK_POINTER(MCTX(&ctx))) ||
install_jump(SIGUSR2, &&usr2_target, STACK_POINTER(MCTX(&ctx))) ) {
printf("Cannot install signal handlers: %s.\n", strerror(errno));
return EXIT_FAILURE;
}
/* These are expressions that should evaluate to false, but the compiler
* should not be able to optimize them away. */
if (argv[0][1] == 'A') {
usr1_target:
fputs("USR1\n", stdout);
fflush(stdout);
}
if (argv[0][1] == 'B') {
usr2_target:
fputs("USR2\n", stdout);
fflush(stdout);
}
while (!done) {
putchar('.');
fflush(stdout);
nanosleep(&sec, NULL);
}
fputs("\nAll done.\n", stdout);
fflush(stdout);
return EXIT_SUCCESS;
}
如果将上面的内容保存为example.c,则可以使用编译
gcc -Wall -O2 example.c -o example
并运行它
./example
按 Ctrl+C 退出程序。复制命令(用于发送SIGUSR1 和SIGUSR2 信号),然后从另一个窗口运行它们,您会看到它们修改了当前执行的位置。 (这些信号导致程序计数器/指令指针跳回,进入一个不应该执行的 if 子句。)
有两组信号处理程序。 handle_done() 只是设置 done 标志。 handle_jump() 向标准错误输出消息(使用低级 I/O),如果指定,则更新程序计数器(指令指针)和堆栈指针。
在创建这样的示例程序时,堆栈指针是棘手的部分。如果我们只满足于让程序崩溃,那将是简单。但是,示例只有在有效时才有用。
当我们任意更改程序计数器/指令指针,并且在函数调用(大多数 C 库函数...)中传递中断时,返回地址留在堆栈上。内核可以在任何时候传递中断,所以我们甚至不能假设中断是在函数调用中传递的!因此,为了确保测试程序不会崩溃,我不得不更新程序计数器/指令指针和堆栈指针。
当接收到跳转信号时,堆栈指针被重置为我使用getcontext() 获得的值。这不保证适用于任何跳跃位置;对于一个最小的例子,这只是我能做的最好的事情。我肯定假设跳转标签就在附近,而不是在编译器可能会弄乱堆栈的子范围内,请注意。
同样重要的是要记住,因为我们正在处理留给 C 编译器的细节,所以我们必须符合编译器生成的任何二进制代码,而不是相反。对于进程及其线程的可靠操作,ptrace() 是一个更好(老实说,更简单)的接口。您只需设置一个父进程,并在目标跟踪的子进程中,明确允许跟踪。我已经向examples here 和here 展示了如何在目标进程中启动、停止和单步执行各个线程。最难的部分是理解整体方案、概念;代码本身比这种信号处理程序上下文操作方式更容易,而且更健壮。
对于自我引入的寄存器错误(程序计数器/指令指针或任何其他寄存器),假设大多数时间导致进程崩溃,此信号处理程序上下文操作应该足够了。