程序员社区

JMM内存模型之重排序

重排序是指编译器和处理器为了优化程序性能而对指令序列进行重新排序的一种手段。

1. 数据依赖性

如果两个操作访问同一个变量,且这两个操作中有一个为写操作,此时这两个操作之间 就存在数据依赖性。数据依赖分为下列3种类型:

JMM内存模型之重排序插图
数据依赖性

上面3种情况,只要重排序两个操作的执行顺序,程序的执行结果就会被改变。
编译器和处理器可能会对操作做重排序。编译器和处理器在重排序时,会遵 守数据依赖性,编译器和处理器不会改变存在数据依赖关系的两个操作的执行顺序。这里所说的数据依赖性仅针对单个处理器中执行的指令序列和单个线程中执行的操作, 不同处理器之间和不同线程之间的数据依赖性不被编译器和处理器考虑。

2. as-if-serial语义

as-if-serial语义的意思是:不管怎么重排序(编译器和处理器为了提高并行度),(单线程) 程序的执行结果不能被改变。编译器、runtime和处理器都必须遵守as-if-serial语义。
为了遵守as-if-serial语义,编译器和处理器不会对存在数据依赖关系的操作做重排序,因 为这种重排序会改变执行结果。但是,如果操作之间不存在数据依赖关系,这些操作就可能被 编译器和处理器重排序。

    double pi = 3.14;        // A
    double r  = 1.0;          // B
    double area = pi * r * r;    // C

上述3个操作数据依赖关系如下:

JMM内存模型之重排序插图1
依赖关系

A和C之间存在数据依赖关系,同时B和C之间也存在数据依赖关系。因此在 最终执行的指令序列中,C不能被重排序到A和B的前面(C排到A和B的前面,程序的结果将会 被改变)。但A和B之间没有数据依赖关系,编译器和处理器可以重排序A和B之间的执行顺序。

JMM内存模型之重排序插图2
程序的两种执行顺序

as-if-serial语义把单线程程序保护了起来,遵守as-if-serial语义的编译器、runtime和处理器 共同为编写单线程程序的程序员创建了一个幻觉:单线程程序是按程序的顺序来执行的。as- if-serial语义使单线程程序员无需担心重排序会干扰他们,也无需担心内存可见性问题。

3.重排序对多线程的影响

class ReorderExample {
    int a = 0;
    boolean flag = false;
    public void writer() {
        a = 1;               // 1
        flag = true;         // 2
    }
    public void reader() {
        if (flag) {          // 3
            int i = a * a;   // 4

        }
    }
}

flag变量是个标记,用来标识变量a是否已被写入。这里假设有两个线程A和B,A首先执行 writer()方法,随后B线程接着执行reader()方法。线程B在执行操作4时,能否看到线程A在操作 1对共享变量a的写入呢?
答案是:不一定能看到。
由于操作1和操作2没有数据依赖关系,编译器和处理器可以对这两个操作重排序;同样, 操作3和操作4没有数据依赖关系,编译器和处理器也可以对这两个操作重排序。让我们先来 看看,当操作1和操作2重排序时,可能会产生什么效果?请看下面的程序执行时序图,如图所示。

JMM内存模型之重排序插图3
程序执行时序图

操作1和操作2做了重排序。程序执行时,线程A首先写标记变量flag,随后线 程B读这个变量。由于条件判断为真,线程B将读取变量a。此时,变量a还没有被线程A写入,在 这里多线程程序的语义被重排序破坏了!
下面再让我们看看,当操作3和操作4重排序时会产生什么效果(借助这个重排序,可以顺 便说明控制依赖性)。下面是操作3和操作4重排序后,程序执行的时序图,如图所示。

JMM内存模型之重排序插图4
程序执行时序图

在程序中,操作3和操作4存在控制依赖关系。当代码中存在控制依赖性时,会影响指令序 列执行的并行度。为此,编译器和处理器会采用猜测(Speculation)执行来克服控制相关性对并 行度的影响。以处理器的猜测执行为例,执行线程B的处理器可以提前读取并计算a*a,然后把 计算结果临时保存到一个名为重排序缓冲(Reorder Buffer,ROB)的硬件缓存中。当操作3的条 件判断为真时,就把该计算结果写入变量i中。
在单线程程序中,对存在控制依赖的操作重排序,不会改变执行结果(这也是as-if-serial 语义允许对存在控制依赖的操作做重排序的原因);但在多线程程序中,对存在控制依赖的操 作重排序,可能会改变程序的执行结果。

赞(0) 打赏
未经允许不得转载:IDEA激活码 » JMM内存模型之重排序

一个分享Java & Python知识的社区