【问题标题】:GCC inline - push address, not its value to stackGCC inline - 推送地址,而不是堆栈的值
【发布时间】:2014-10-30 18:59:11
【问题描述】:

我正在试验 GCC 的内联汇编程序(我使用 MinGW,我的操作系统是 Win7)。 现在我只能让一些基本的 C stdlib 函数工作。我通常熟悉 Intel 语法,但对 AT&T 不熟悉。

以下代码运行良好:

char localmsg[] = "my local message";
asm("leal %0, %%eax" : "=m" (localmsg));
asm("push %eax");
asm("call %0" : : "m" (puts));
asm("add $4,%esp");

然而,LEA 似乎是多余的,因为我可以直接将值压入堆栈。好吧,由于我认为这是 AT&T 的特点,所以这样做:

asm("push %0" : "=m" (localmsg));

将在最终的可执行文件中生成以下汇编代码:

PUSH DWORD PTR SS:[ESP+1F]

因此,不是将地址推送到我的字符串,而是推送其内容,因为“指针”被“取消引用”,用 C 术语来说。这显然会导致崩溃。

我相信这只是 GAS 的正常行为,但我找不到任何有关如何克服此问题的信息。如有任何帮助,我将不胜感激。

附:我知道这对于那些有经验的人来说是一个微不足道的问题。我预计会被否决,但我花了 45 分钟寻找解决方案,但一无所获。

附言我意识到这样做的正确方法是在 C 代码中调用 puts( )。这纯粹是出于教育/实验的原因。

【问题讨论】:

  • asm("push %0" : "=m" (&localmsg)); 工作吗?
  • @markgz 不,它抱怨“asm 语句中需要左值”。无论如何,我认为这没有多大意义,因为 localmsg 已经是一个指针。
  • 为什么将 localmsg 标记为输出操作数?
  • @MarcGlisse 我的错误,我不明白第一个冒号总是用于输出,无论修饰符如何。但是,这对我的问题没有影响。

标签: c gcc inline-assembly att


【解决方案1】:

虽然内联汇编总是有点棘手,但从中调用函数尤其具有挑战性。对于“了解内联 asm”项目,我不建议这样做。如果您还没有,我建议您查看最新的内联 asm docs。已经做了很多工作来尝试解释内联 asm 的工作原理。

也就是说,这里有一些想法:

1) 像这样使用多个 asm 语句是个坏主意。正如docs 所说:不要期望一系列 asm 语句在编译后保持完全连续。如果某些指令需要在输出中保持连续,请将它们放在单个多指令 asm 语句中。

2) 在不让 gcc 知道您正在这样做的情况下直接修改寄存器(就像您使用 eax 所做的那样)也是一个坏主意。您应该使用寄存器约束(这样 gcc 可以选择自己的寄存器)或使用 clobbers 让 gcc 知道您正在使用它们。

3) 当一个函数(如puts)被调用时,虽然有些寄存器必须在返回之前恢复它们的值,但有些寄存器可以被被调用函数当作临时寄存器(即在返回之前修改而不恢复)。正如我在#2 中提到的,让你的 asm 修改寄存器而不通知 gcc 是一个非常糟糕的主意。如果您知道所调用函数的 ABI,则可以将其暂存寄存器添加到 asm 的 clobber 列表中。

4) 虽然在这个特定示例中您使用的是常量字符串,但作为一般规则,当将 asm 指针传递给字符串、结构、数组等时,您可能需要“内存”破坏器来确保任何未决的在开始执行您的 asm 之前执行对内存的写入。

5) 实际上,lea 正在做一些非常重要的事情。 esp 的值在编译时是未知的,所以你不能执行push $12345。有人需要计算(尤其是 localmsg 的偏移量)才能将其推入堆栈。另外,请参见下面的第二个示例。

6) 如果您更喜欢 intel 格式(有什么正确的人不会?),您可以使用 -masm=intel。

考虑到这一切,我对这段代码的第一次剪辑看起来像这样。请注意,这不会破坏 puts 的暂存寄存器。这留作练习......

#include <stdio.h>

int main()
{
  const char localmsg[] = "my local message";

  int result;

  /* Use 'volatile' since 'result' is usually not going to get used,
     which might tempt gcc to discard this asm statement as unneeded. */

  asm volatile ("push %[msg] \n\t"   /* Push the address of the string. */
                "call %[puts] \n \t" /* Call the print function. */
                "add $4,%%esp"       /* Clean up the stack. */

                : "=a" (result) /* The result code from puts. */
                : [puts] "m" (puts), [msg] "r" (localmsg)
                : "memory", "esp");

   printf("%d\n", result);
}

确实,这并不能避免由于#5 而出现的lea。但是,如果这真的很重要,试试这个:

#include <stdio.h>
const char localmsg[] = "my local message";

int main()
{

  int result;

  /* Use 'volatile' since 'result' is usually not going to get used. */

  asm volatile ("push %[msg] \n\t" /* Push the address of the string. */
                "call %[puts] \n \t" /* Call the print function. */
                "add $4,%%esp"       /* Clean up the stack. */

                : "=a" (result) /* The result code. */
                : [puts] "m" (puts), [msg] "i" (localmsg)
                : "memory", "esp");

   printf("%d\n", result);
}

作为一个全局变量,localmsg 的地址现在在编译时是已知的(好吧,我在简化一点),生成的 asm 如下所示:

push $__ZL8localmsg
call _puts
add $4,%esp

多田。

【讨论】:

  • 优秀的答案。我非常喜欢 Intel 的语法,但我不确定如何让它与扩展的语法和变量一起工作。
  • 我给你的内联 asm 文档的文档链接讨论了如何使用变量(包含许多示例)。如果您来自 MS 的编译器,则需要忘记在 asm 中使用符号名称的想法。 (实际上)所有变量都需要指定为输入或输出。至于“让英特尔工作”,这没什么。考虑一下这个(无用的)asm 语句:asm("movl $0, %eax");。用gcc foo.cpp编译,编译不会出错。用gcc -masm=intel foo.cpp编译,除非你改成intel语法会报错:asm("mov eax, 0");
  • 是的,但我的意思是“参数”“传递”到内联 ASM 代码,就像您帮助我的示例一样。它是 ATT 中的 [name] 或 %0,我应该怎么做才能让它在 Intel 中工作?
  • 完全相同([name] 或 %0)。这些不是 att 的产物,它们只是 gcc 如何将参数放入 asm 中的适当位置。将第一个参数中的字符串视为 fprintf 的模板。当编译器编译 asm 语句时,它只需要所有的 %0 和 %[name],替换约束中的内容并将结果字符串输出到汇编器。
  • 使用 .intel_syntax 不会将 c 编译器“切换”为使用 intel 格式。就 c 而言,这只是另一个输出到汇编器的任意字符串(它确实改变了汇编器解释代码的方式)。如果要改变编译器输出的代码格式,需要使用-masm。从理论上讲,您可以使用.intel_syntax/.att_syntax 包装所有 asm 字符串,但这可能会引入其他问题。使用 -masm 有什么问题?还是您正在编写公共标头?一个 asm 语句可能同时支持两者:asm("{mov $0, %0|mov %0, 0}" ...
猜你喜欢
  • 1970-01-01
  • 2016-12-11
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-11-22
  • 2023-03-20
  • 1970-01-01
  • 2014-08-21
相关资源
最近更新 更多