【发布时间】:2010-12-01 05:39:21
【问题描述】:
假设我在源文件中有这个小函数
static void foo() {}
我构建了我的二进制文件的优化版本,但我不想内联这个函数(出于优化目的)。我可以在源代码中添加一个宏来防止内联吗?
【问题讨论】:
-
感谢您提出这个问题!当一个函数没有出现时,我正在使用 oprofile 进行分析,这里的答案解决了这个问题。
假设我在源文件中有这个小函数
static void foo() {}
我构建了我的二进制文件的优化版本,但我不想内联这个函数(出于优化目的)。我可以在源代码中添加一个宏来防止内联吗?
【问题讨论】:
【讨论】:
您需要 gcc 特定的 noinline 属性。
此功能属性可防止 从被考虑的功能 内联。如果函数没有 有副作用,有 内联以外的优化 导致函数调用被优化 离开,虽然函数调用是 居住。为了防止这样的电话 优化了,放
asm ("");
像这样使用它:
void __attribute__ ((noinline)) foo()
{
...
}
【讨论】:
一种可移植的方式是通过指针调用函数:
void (*foo_ptr)() = foo;
foo_ptr();
虽然这会产生不同的分支指令,但这可能不是您的目标。这提出了一个很好的观点:您的目标是什么?
【讨论】:
volatile 使其再次工作。跨度>
如果您收到__attribute__((noinline)) 的编译器错误,您可以尝试:
noinline int func(int arg)
{
....
}
【讨论】:
static __attribute__ ((noinline)) void foo()
{
}
这对我有用。
【讨论】:
GCC 有一个开关叫做
-fno-inline-small-functions
所以在调用 gcc 时使用它。但副作用是所有其他小函数也是非内联的。
【讨论】:
-fno-inline 根本不起作用。 gdb 仍会进入跨步方法。有东西坏了,我怀疑是gdb。
我使用 gcc 7.2。我特别需要一个非内联函数,因为它必须在库中实例化。我尝试了__attribute__((noinline)) 答案以及asm("") 答案。两者都没有解决问题。
最后,我发现在函数内部定义一个静态变量将强制编译器在静态变量块中为其分配空间,并在函数第一次调用时为其发出初始化。
这是一种肮脏的伎俩,但它确实有效。
【讨论】:
inline void foo(void) { ... },并在库源文件中声明它extern inline void foo(void);。遵循 C99 语义,编译器可以在需要时内联函数并在您的库中发出目标代码。见Is "inline" without "static" or "extern" ever useful in C99 ?。
我知道这个问题是关于 GCC 的,但我认为它可能对 有一些关于其他编译器的编译器信息。
GCC 的
noinline
function 属性在其他编译器中也很受欢迎。它
至少得到以下支持:
__has_attribute(noinline) 核对)__TI_GNU_ATTRIBUTE_SUPPORT__)此外,MSVC 支持
__declspec(noinline)
回到 Visual Studio 7.1。英特尔可能也支持它(他们试图
与 GCC 和 MSVC 兼容),但我没有费心
验证这一点。语法基本相同:
__declspec(noinline)
static void foo(void) { }
PGI 10.2+(可能更早)支持noinline pragma
适用于下一个函数:
#pragma noinline
static void foo(void) { }
TI 6.0+ 支持
FUNC_CANNOT_INLINE
pragma (令人讨厌)在 C 和 C++ 中的工作方式不同。在 C++ 中,它类似于 PGI:
#pragma FUNC_CANNOT_INLINE;
static void foo(void) { }
然而,在 C 中,函数名是必需的:
#pragma FUNC_CANNOT_INLINE(foo);
static void foo(void) { }
Cray 6.4+(可能更早)采用了类似的方法,需要 函数名:
#pragma _CRI inline_never foo
static void foo(void) { }
Oracle Developer Studio 还支持一个 pragma,它采用 函数名,返回at least Forte Developer 6, 但请注意,它需要在声明之后,即使在最近 版本:
static void foo(void);
#pragma no_inline(foo)
根据您的专注程度,您可以创建一个宏 可以在任何地方工作,但您需要将函数名称设置为 以及作为参数的声明。
如果,OTOH,你对适合大多数人的东西没意见, 你可以摆脱一些更美观的东西 令人愉悦,不需要重复自己。这就是方法 我选择了Hedley,其中 当前版本 HEDLEY_NEVER_INLINE 看起来像:
#if \
HEDLEY_GNUC_HAS_ATTRIBUTE(noinline,4,0,0) || \
HEDLEY_INTEL_VERSION_CHECK(16,0,0) || \
HEDLEY_SUNPRO_VERSION_CHECK(5,11,0) || \
HEDLEY_ARM_VERSION_CHECK(4,1,0) || \
HEDLEY_IBM_VERSION_CHECK(10,1,0) || \
HEDLEY_TI_VERSION_CHECK(8,0,0) || \
(HEDLEY_TI_VERSION_CHECK(7,3,0) && defined(__TI_GNU_ATTRIBUTE_SUPPORT__))
# define HEDLEY_NEVER_INLINE __attribute__((__noinline__))
#elif HEDLEY_MSVC_VERSION_CHECK(13,10,0)
# define HEDLEY_NEVER_INLINE __declspec(noinline)
#elif HEDLEY_PGI_VERSION_CHECK(10,2,0)
# define HEDLEY_NEVER_INLINE _Pragma("noinline")
#elif HEDLEY_TI_VERSION_CHECK(6,0,0)
# define HEDLEY_NEVER_INLINE _Pragma("FUNC_CANNOT_INLINE;")
#else
# define HEDLEY_NEVER_INLINE HEDLEY_INLINE
#endif
如果您不想使用 Hedley(它是一个公共域 / CC0 标头)您可以转换版本检查宏而无需太多 努力,但比我愿意付出的更多 ☺。
【讨论】: