从汇编角度理解 volatile

先抛出结论：c 语言 volatile 关键字的作用在于提示编译器，这个变量值可能被多线程修改，要从内存读取。

假设测试：有一个全局变量 i 初始值为 0，线程 A 轮询 i 的值，当i 的值为 1 时退出；线程 B 在某一时刻改变 i 的值，然后退出。主线程等待 A 和 B 都退出后再退出。正常情况下总能让所有线程均正常结束。

测试

#include<stdlib.h>
#include<pthread.h>

int i=0;

void* threadA() {
  for(;!i;) {}
}

void* threadB() {
  i=1;
}

int main() {
  pthread_t a;
  pthread_t b;

  pthread_create(&a, NULL, threadA, NULL);
  pthread_create(&b, NULL, threadB, NULL);

  void* ret;
  pthread_join(a, &ret);
  pthread_join(b, &ret);
}

编译并重复运行，程序可能卡住无法正常结束。

$ ./no-volatile.out

带上 volatile 关键字重新编译测试

#include<stdlib.h>
#include<pthread.h>

volatile int i=0;

void* threadA() {
  for(;!i;) {}
}

void* threadB() {
  i=1;
}

int main() {
  pthread_t a;
  pthread_t b;

  pthread_create(&a, NULL, threadA, NULL);
  pthread_create(&b, NULL, threadB, NULL);

  void* ret;
  pthread_join(a, &ret);
  pthread_join(b, &ret);
}

编译并重复运行，程序总能正常结束。

$ ./volatile.out

从汇编理解原因

这是什么原因？将这两段代码分别编译成汇编文件

gcc -Os -S -o no-volatile.s no-volatile.c
gcc -Os -S -o volatile.s volatile.c

查看 no-volatile.s 文件

threadA:
.LFB6 = .
  .cfi_startproc
  la.local  $r13,i
.L2:
  ldptr.w $r12,$r13,0
  beqz  $r12,.L2
  jr  $r1
  .cfi_endproc
.LFE6:
  .size threadA, .-threadA
  .align  2
  .globl  threadB
  .type threadB, @function

可以看到

8:  线程 A 加载变量 i 的地址到 r13 寄存器
10: 读取 r13 的值所指向的内存，即从内存中读取 i 的值
11: 如果值为 0 ，跳到 .L2，然后再次读取循环，否则继续执行 12 行，退出线程。

这个程序逻辑和我们期望的是一致的，一旦 i 的值发生改变，总可以读到 i 的新值然后退出线程。

查看 volatile.s 文件

 5 threadA:
 6 .LFB6 = .
 7   .cfi_startproc
 8   la.local  $r12,i
 9   ldptr.w $r12,$r12,0
10   bnez  $r12,.L5
11 .L4:
12   b .L4
13 .L5:
14   jr  $r1
15   .cfi_endproc

查看行号对应的汇编代码

8: 加载变量 i 的地址到 r12
9: 从内存读取变量 i 的值到 r12
10： 如果 r12 不等于 0，则跳到 .L5 即退出线程，否则，继续走到 .L4。一旦程序走到 12 行，将陷入循环。不会再次读取值做比较。

在不带 volatile 的情况下，程序行为和我们预期的不一致，程序无法正常退出。

总结

这里就明白了，要从内存中读取被 volatile 修饰的变量是什么意思。总之，在并发环境下，共享变量都应该加上 volatile 修饰。否则会因为 gcc 的一些编译优化行为造成语义不一致。