考虑以下浓缩代码:为什么__sync_add_and_fetch适用于32位系统上的64位变量?
/* Compile: gcc -pthread -m32 -ansi x.c */
#include <stdio.h>
#include <inttypes.h>
#include <pthread.h>
static volatile uint64_t v = 0;
void *func (void *x) {
__sync_add_and_fetch (&v, 1);
return x;
}
int main (void) {
pthread_t t;
pthread_create (&t, NULL, func, NULL);
pthread_join (t, NULL);
printf ("v = %"PRIu64"\n", v);
return 0;
}
我有一个uint64_t
变量,我想原子方式增加,因为变量是在多线程程序计数器。 为了达到原子性,我使用GCC的atomic builtins。
如果我为amd64系统编译(-m64),生成的汇编代码很容易理解。 通过使用lock addq
,处理器保证增量为原子。
400660: f0 48 83 05 d7 09 20 lock addq $0x1,0x2009d7(%rip)
但相同的C代码生成的IA32系统上一个非常复杂的ASM代码(-m32):
804855a: a1 28 a0 04 08 mov 0x804a028,%eax
804855f: 8b 15 2c a0 04 08 mov 0x804a02c,%edx
8048565: 89 c1 mov %eax,%ecx
8048567: 89 d3 mov %edx,%ebx
8048569: 83 c1 01 add $0x1,%ecx
804856c: 83 d3 00 adc $0x0,%ebx
804856f: 89 ce mov %ecx,%esi
8048571: 89 d9 mov %ebx,%ecx
8048573: 89 f3 mov %esi,%ebx
8048575: f0 0f c7 0d 28 a0 04 lock cmpxchg8b 0x804a028
804857c: 08
804857d: 75 e6 jne 8048565 <func+0x15>
这是我不明白:
lock cmpxchg8b
确实保证只有当期望值仍驻留在目标地址中时才会写入已更改的变量。比较和交换保证以原子方式发生。- 但是什么保证读取0x804855a和0x804855f中的变量是原子?
也许这并不重要,如果有一个“脏读”,但可能有人请勾勒出一个短证明,有没有问题?
此外:为什么生成的代码跳回到0x8048565而不是0x804855a?如果其他作者也只增加变量,我认为这是正确的。这是__sync_add_and_fetch
函数的一个暗示要求吗?