声明:我刚开始使用x86汇编。我在大学学到了一点SPIM,但是这不值得一提。手动装配vs GCC
我以为我从libc,abs()中最简单的函数开始。
long myAbs(long j) {
return j < 0 ? -j : j;
}
我的版本中装配:用C非常简单
.global myAbs
.type myAbs, @function
.text
myAbs:
test %rdi, %rdi
jns end
negq %rdi
end:
movq %rdi, %rax
ret
(这并不适用于32位整数的工作,可能是因为RAX是一个64位的寄存器和标志可能是在错误的位置 - 我必须调查)。
现在这里是gcc在(GCC -02 -S myAbs.c):
.file "myAbs.c"
.section .text.unlikely,"ax",@progbits
.LCOLDB0:
.text
.LHOTB0:
.p2align 4,,15
.globl myAbs
.type myAbs, @function
myAbs:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
subq $4144, %rsp
orq $0, (%rsp)
addq $4128, %rsp
movq %rdi, %rdx
sarq $63, %rdx
movq %fs:40, %rax
movq %rax, -8(%rbp)
xorl %eax, %eax
movq %rdi, %rax
xorq %rdx, %rax
subq %rdx, %rax
movq -8(%rbp), %rcx
xorq %fs:40, %rcx
jne .L5
leave
.cfi_remember_state
.cfi_def_cfa 7, 8
ret
.L5:
.cfi_restore_state
call [email protected]
.cfi_endproc
.LFE0:
.size myAbs, .-myAbs
.section .text.unlikely
.LCOLDE0:
.text
.LHOTE0:
.ident "GCC: (Gentoo Hardened 5.1.0 p1.2, pie-0.6.3) 5.1.0"
.section .note.GNU-stack,"",@progbits
为什么这样大的差别?海湾合作委员会产生更多的指示我无法想象这不会比我的代码慢。 我错过了什么吗?或者我在这里做了一些严重错误的事情?
也许你的海湾合作委员会感到不适?矿产生[减少指令](https://goo.gl/wG2v1X)。 (和Clang喜欢[有条件的移动](https://goo.gl/xpxKyi)。) –
“GCC :(Gentoo硬化5.1.0 p1.2,饼-0.6.3)5.1.0” - 我认为这是线索。强化的C编译器集成了堆栈粉碎保护或类似的功能。 – davmac
许多开始的调用是设置堆栈并保存返回地址(你没有做的事情)。看起来像是一些堆栈保护正在进行。也许你可以调整你的编译器设置以消除一些开销。 – carloabelli