C/C 编译器是否使用 Push/Pop 指令来创建局部变量？-C++-PHP中文网

C/C 编译器是否使用 Push/Pop 指令来创建局部变量？

Mary-Kate Olsen

发布： 2024-12-09 11:58:10

原创

344 人浏览过

Do C/C Compilers Utilize Push/Pop Instructions for Local Variable Creation?

具有局部变量的 Push/Pop 指令的 C/C 编译器

简介

传统的 C/C 编译器通过增加堆栈指针来创建局部变量（ESP）一次。然而，使用入栈/出栈指令可以产生更紧凑且可能更快的代码。本文探讨了哪些编译器提供此优化。

编译器支持

研究表明所有四种主要 x86 编译器（GCC、Clang、ICC 和 MSVC）当前都不使用推送/弹出创建局部变量的指令。相反，他们更喜欢旧方法的变体，使用 sub rsp, c 来减少堆栈指针。

Push/Pop 的优点

对局部变量使用 push/pop 有几个优点：

代码大小减少：推送指令与sub/mov 对为 9-11 个字节。
潜在的性能改进：在具有堆栈引擎的 CPU 上，推送操作可能比 sub rsp 产生更少的堆栈同步 uops，从而使其速度更快

何时避免 Push/Pop

虽然 Push/Pop 可以是有益的，但不建议在所有情况下都这样做。例如，与 [rsp x] 寻址模式混合时，它可能会导致额外的堆栈同步 uops。

实际用例

考虑以下函数：

int extfunc(int *,int *);

void foo() {
    int a=1, b=2;
    extfunc(&a, &b);
}

登录后复制

使用改进的编译push/pop:

# compiled for the x86-64 System V calling convention:
# integer args in rdi, rsi  (,rdx, rcx, r8, r9)
    push    2                   # only 2 bytes
    lea     rdi, [rsp + 4]
    mov     dword ptr [rdi], 1
    mov     rsi, rsp                # special case for lea rsi, [rsp + 0]
    call    extfunc(int*, int*)
    pop     rax                   # alternative to add rsp,8
    ret

登录后复制

注意： 此示例通过将 push 指令的最后 4 个字节与 lea 指令的前 4 个字节重叠来优化紧凑性和速度.