【问题标题】:How to get all Global Variables referenced by instruction in LLVM?如何获取 LLVM 中指令引用的所有全局变量?
【发布时间】:2017-10-02 20:29:31
【问题描述】:

在下面的示例中,我试图提取每条指令引用的所有全局变量,但我总是遗漏一些。

... // inside a BB
for (Instruction * I : BB) {
  for (Use &U : I->operands()) {
    if(GlobalVariable * GV = dyn_cast<GlobalVariable >(U)){
      // Do something with GV
      GV->dump();
    }
  }
}

但是当我的目标是获取以下全局值时:

@end = global i8 0, align 1
@.str = private unnamed_addr constant [4 x i8] c"YES\00", align 1
@.str.2 = private unnamed_addr constant [3 x i8] c"NO\00", align 1

define void @TempF() {
entry:
  %tmp8 = load i8, i8* @end, align 1
  %tmp9 = trunc i8 %tmp8 to i1
  %tmp10 = select i1 %tmp9, i8* getelementptr inbounds ([4 x i8], [4 x i8]* @.str, i32 0, i32 0), i8* getelementptr inbounds ([3 x i8], [3 x i8]* @.str.2, i32 0, i32 0)
  ret void
}

在这个 IR 上运行我的通行证时,只有 @end = global i8 0, align 1 被打印出来。但不是...

@.str = private unnamed_addr constant [4 x i8] c"YES\00", align 1
@.str.2 = private unnamed_addr constant [3 x i8] c"NO\00", align 1

我知道@.str 不像@end 那样是操作数的一部分。 @.str 是被其中一个操作数引用的东西。

我必须进行哪些修改才能在操作数中获取全局变量?

【问题讨论】:

  • 如果你-&gt;dump() 在你的 if 之外怎么办?那你还看到了哪些其他操作数?可能你需要另一个 if(s) 来对它们的内容采取相应的行动,不是吗?
  • @Stanislav,是的,在看到@Brian 的回答后,我完全同意你的看法。但我想避免为每个极端情况编写代码。我想我会通过构建一个包含所有非 GV 运算符的集合并验证哪些可能有操作数 (getNumOperands()!=0) 来解决它,类似于 Brian 所做的,但也许通过将它们转换为指令。仍在努力实施。我假设只有指令有操作数是正确的吗?

标签: c++ compiler-construction llvm


【解决方案1】:

在您的情况下,选择指令具有 GetElementPtr operators。您将需要扩展代码以检测这种情况,然后将参数(指针和)迭代到运算符。我建议在下面对您的 for 循环进行扩展,目前正在打印这些其他情况。

for (Use &U : (&*I)->operands()) {
    if(GlobalVariable * GV = dyn_cast<GlobalVariable>(U)){
      // Do something with GV
      GV->dump();
    }
    else if (GEPOperator* gepo = dyn_cast<GEPOperator>(&U))
    {
        errs() << "GEPO - " << *gepo << "\n";
        if (GlobalVariable* gv = dyn_cast<GlobalVariable>(gepo->getPointerOperand()))
        {
            errs() << "GV - " << *gv << "\n";
        }
        for (auto it = gepo->idx_begin(), et = gepo->idx_end(); it != et; ++it)
        {
            if (GlobalVariable* gv = dyn_cast<GlobalVariable>(*it))
            {
                errs() << "GVi - " << *gv <<  "\n";
            }
        }
    }
}

【讨论】:

  • 你好@Brian,谢谢你的回答。考虑到我想成为通用的,还有其他我应该注意的极端情况吗?有机会获得另一个“级别”的 GEP 指令吗?我是否通过正确的方向来解决这个问题?我的另一个想法是从 SRC 模块获取所有全局并复制到 DST 模块(包含较少的指令),并删除未使用的 GV(类似于extract-function.cpp),您认为这是更好的方法吗?跨度>
  • 我认为任何其他级别的 GEP 都会使用其他值,因此应该已经单独检测到这些值。请注意,这些是运算符,这个问题讨论了一些差异:stackoverflow.com/questions/33574522/…。在我的工作中,我其实很在意区别,所以我一直在处理不同的案例。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-01-14
  • 2015-07-12
  • 2022-11-16
  • 2017-08-02
相关资源
最近更新 更多