我们来解读一下GCC 5.1的源码
我们将尝试了解 -O100 上发生的情况,因为手册页上并不清楚。
我们将得出结论:
-
-O3 到 INT_MAX 上的任何内容都与 -O3 相同,但将来很容易改变,所以不要依赖它。
- 如果您输入大于
INT_MAX 的整数,GCC 5.1 会运行未定义的行为。
- 参数只能有数字,否则会正常失败。特别是,这不包括像
-O-1 这样的负整数
关注子程序
首先要记住,GCC 只是 cpp、as、cc1、collect2 的前端。一个快速的./XXX --help 说只有collect2 和cc1 接受-O,所以让我们关注它们。
还有:
gcc -v -O100 main.c |& grep 100
给予:
COLLECT_GCC_OPTIONS='-O100' '-v' '-mtune=generic' '-march=x86-64'
/usr/local/libexec/gcc/x86_64-unknown-linux-gnu/5.1.0/cc1 [[noise]] hello_world.c -O100 -o /tmp/ccetECB5.
所以-O 被转发到cc1 和collect2。
O in common.opt
common.opt 是internals documentation 中描述的GCC 特定CLI 选项描述格式,并由opth-gen.awk 和optc-gen.awk 转换为C。
它包含以下有趣的行:
O
Common JoinedOrMissing Optimization
-O<number> Set optimization level to <number>
Os
Common Optimization
Optimize for space rather than speed
Ofast
Common Optimization
Optimize for speed disregarding exact standards compliance
Og
Common Optimization
Optimize for debugging experience rather than speed or size
指定所有O 选项。请注意-O<n> 与其他Os、Ofast 和Og 是如何在不同的家庭中的。
当我们构建时,这会生成一个 options.h 文件,其中包含:
OPT_O = 139, /* -O */
OPT_Ofast = 140, /* -Ofast */
OPT_Og = 141, /* -Og */
OPT_Os = 142, /* -Os */
作为奖励,当我们在 common.opt 中寻找 \bO\n 时,我们注意到以下行:
-optimize
Common Alias(O)
这告诉我们--optimize(双破折号,因为它在.opt 文件上以破折号-optimize 开头)是-O 的未记录别名,可用作--optimize=3!
使用 OPT_O 的地方
现在我们 grep:
git grep -E '\bOPT_O\b'
将我们指向两个文件:
我们先来追踪opts.c
opts.c:default_options_optimization
所有opts.c 的使用都发生在内部:default_options_optimization。
我们grep backtrack看谁调用了这个函数,我们看到唯一的代码路径是:
main.c:main
toplev.c:toplev::main
opts-global.c:decode_opts
opts.c:default_options_optimization
而main.c 是cc1 的入口点。好!
这个函数的第一部分:
- 在
OPT_O对应的字符串上调用atoi的integral_argument解析输入参数
- 将值存储在
opts->x_optimize 中,其中opts 是struct gcc_opts。
结构 gcc_opts
grep 无效后,我们注意到struct 也是在options.h 处生成的:
struct gcc_options {
int x_optimize;
[...]
}
x_optimize 的来源:
Variable
int optimize
出现在common.opt,以及options.c:
struct gcc_options global_options;
所以我们猜测这是包含整个配置全局状态的内容,int x_optimize 是优化值。
255 是内部最大值
在opts.c:integral_argument 中,atoi 应用于输入参数,因此INT_MAX 是一个上限。如果你放任何更大的东西,GCC 似乎会运行 C 未定义的行为。哎哟?
integral_argument 还对atoi 进行了薄包装,如果任何字符不是数字,则拒绝该参数。所以负值会优雅地失败。
回到opts.c:default_options_optimization,我们看到一行:
if ((unsigned int) opts->x_optimize > 255)
opts->x_optimize = 255;
因此优化级别被截断为255。在阅读opth-gen.awk 时,我遇到了:
# All of the optimization switches gathered together so they can be saved and restored.
# This will allow attribute((cold)) to turn on space optimization.
并在生成的options.h:
struct GTY(()) cl_optimization
{
unsigned char x_optimize;
这解释了为什么截断:选项也必须转发到cl_optimization,它使用char 来节省空间。所以 255 实际上是一个内部最大值。
opts.c:maybe_default_options
回到opts.c:default_options_optimization,我们遇到了maybe_default_options,这听起来很有趣。我们输入它,然后maybe_default_option 到达一个大开关:
switch (default_opt->levels)
{
[...]
case OPT_LEVELS_1_PLUS:
enabled = (level >= 1);
break;
[...]
case OPT_LEVELS_3_PLUS:
enabled = (level >= 3);
break;
没有>= 4 检查,这表明3 是最大的可能。
然后我们在common-target.h中搜索OPT_LEVELS_3_PLUS的定义:
enum opt_levels
{
OPT_LEVELS_NONE, /* No levels (mark end of array). */
OPT_LEVELS_ALL, /* All levels (used by targets to disable options
enabled in target-independent code). */
OPT_LEVELS_0_ONLY, /* -O0 only. */
OPT_LEVELS_1_PLUS, /* -O1 and above, including -Os and -Og. */
OPT_LEVELS_1_PLUS_SPEED_ONLY, /* -O1 and above, but not -Os or -Og. */
OPT_LEVELS_1_PLUS_NOT_DEBUG, /* -O1 and above, but not -Og. */
OPT_LEVELS_2_PLUS, /* -O2 and above, including -Os. */
OPT_LEVELS_2_PLUS_SPEED_ONLY, /* -O2 and above, but not -Os or -Og. */
OPT_LEVELS_3_PLUS, /* -O3 and above. */
OPT_LEVELS_3_PLUS_AND_SIZE, /* -O3 and above and -Os. */
OPT_LEVELS_SIZE, /* -Os only. */
OPT_LEVELS_FAST /* -Ofast only. */
};
哈!这是一个强有力的指标,表明只有 3 个级别。
opts.c:default_options_table
opt_levels 太有趣了,我们 grep OPT_LEVELS_3_PLUS,然后遇到opts.c:default_options_table:
static const struct default_options default_options_table[] = {
/* -O1 optimizations. */
{ OPT_LEVELS_1_PLUS, OPT_fdefer_pop, NULL, 1 },
[...]
/* -O3 optimizations. */
{ OPT_LEVELS_3_PLUS, OPT_ftree_loop_distribute_patterns, NULL, 1 },
[...]
}
所以这是 -On 到文档中提到的特定优化映射的编码位置。不错!
确保不再使用 x_optimize
x_optimize 的主要用途是设置其他特定的优化选项,如手册页中所述的-fdefer_pop。还有吗?
我们grep,并找到更多。数量很少,人工检查发现每次使用最多只做一个x_optimize >= 3,所以我们的结论成立。
lto-wrapper.c
现在我们寻找OPT_O 的第二次出现,它在lto-wrapper.c 中。
LTO 表示链接时间优化,顾名思义,它需要一个-O 选项,并将链接到collec2(基本上是一个链接器)。
其实lto-wrapper.c的第一行说:
/* Wrapper to call lto. Used by collect2 and the linker plugin.
在这个文件中,OPT_O 的出现似乎只是规范了 O 的值以将其向前传递,所以我们应该没问题。