78. 同步访问共享的可变数据

　　关键字 synchronized 可以保证在同一时刻，只有一个线程可以执行某一个方法，或者某一个代码块。许多程序员把同步的概念仅仅理解为一种互斥（ mutual exclusion ）的方式，即，当一个对象被一个线程修改的时候，可以阻止另一个线程观察到对象内部不一致的状态。按照这种观点，对象被创建的时候处于一致的状态（详见第 17 条），当有方法访问它的时候，它就被锁定了。这些方法观察到对象的状态，并且可能会引起状态转变（ statetransition ），即把对象从一种一致的状态转换到另一种一致的状态。正确地使用同步可以保证没有任何方法会看到对象处于不一致的状态中。

　　这种观点是正确的，但是它并没有说明同步的全部意义。如果没有同步，一个线程的变化就不能被其他线程看到。同步不仅可以阻止一个线程看到对象处于不一致的状态之中，它还可以保证进入同步方法或者同步代码块的每个线程，都能看到由同一个锁保护的之前所有的修改效果。

　　Java 语言规范保证读或者写一个变量是原子的（ atomic ），除非这个变量的类型为 long 或者 double [JLS , 17.4, 17.7］。换句话说，读取一个非 long 或 double 类型的变量，可以保证返回值是某个线程保存在该变量中的，即使多个线程在没有同步的情况下并发地修改这个变量也是如此。

　　你可能昕说过，为了提高性能，在读或写原子数据的时候，应该避免使用同步。这个建议是非常危险而错误的。虽然语言规范保证了线程在读取原子数据的时候，不会看到任意的数值，但是它并不保证一个线程写入的值对于另一个线程将是可见的。 为了在线程之间进行可靠的通信，也为了互斥访问，同步是必要的。 这归因于 Java 语言规范中的内存模型（memory model），它规定了一个线程所做的变化何时以及如何变成对其他线程可见[JLS ,17.4; Goetz06, 16]。

　　如果对共享的可变数据的访问不能同步，其后果将非常可怕，即使这个变量是原子可读写的。以下面这个阻止一个线程妨碍，另一个线程的任务为例。Java 的类库中提供了 Thread.stop 方法，但是在很久以前就不提倡使用该方法了，因为它本质上是不安全的一一使用它会导致数据遭到破坏。 千万不要使用 Thread.stop 方法。 要阻止一个线程妨碍另一个线程，建议的做法是让第一个线程轮询（ poll ）一个 boolean 字段，这个字段一开始为 false ，但是可以通过第二个线程设置为 true ，以表示第一个线程将终止自己。由于 boolean 字段的读和写操作都是原子的，程序员在访问这个字段的时候不再需要使用同步：

// Broken! - How long would you expect this program to run?
public class StopThread {
    private static Boolean stopRequested;
    
    public static void main(String[] args) 
            throws InterruptedException {
        Thread backgroundThread = new Thread(() -> {
            int i = 0;
            while (!stopRequested)
            i++;
        });
        backgroundThread.start();
        TimeUnit.SECONDS.sleep(1);
        stopRequested = true;
    }
}

　　你可能期待这个程序运行大约一秒钟左右，之后主线程将 stopRequested 设置为 true ，致使后台线程的循环终止。但是在我的机器上，这个程序永远不会终止：因为后台线程永远在循环！

　　问题在于，由于没有同步，就不能保证后台线程何时‘看到’主线程对 stopRequested 的值所做的改变。没有同步，虚拟机将以下代码：

while (!stopRequested)
    i++;

　　转变成这样：

if (!stopRequested)
    while (true)
        i++;

　　这种优化称作提升（ hoisting ），正是 OpenJDK Server VM 的工作。结果是一个活性失败（liveness failure）：这个程序并没有得到提升。修正这个问题的一种方式是同步访问 stopRequested 字段。这个程序会如预期般在大约一秒之内终止：

// Properly synchronized cooperative thread termination
public class StopThread {
    private static Boolean stopRequested;
    private static synchronized void requestStop() {
        stopRequested = true;
    }
    private static synchronized Boolean stopRequested() {
        return stopRequested;
    }
    public static void main(String[] args)
            throws InterruptedException {
        Thread backgroundThread = new Thread(() -> {
            int i = 0;
            while (!stopRequested())
                i++;
        });
        backgroundThread.start();
        TimeUnit.SECONDS.sleep(1);
        requestStop();
    }
}

　　注意写方法（ requestStop ）和读方法（ stopRequested ）都被同步了。只同步写方法还不够！ 除非读和写操作都被同步，否则无法保证同步能起作用。 有时候，会在某些机器上看到只同步了写（或读）操作的程序看起来也能正常工作，但是在这种情况下，表象具有很大的欺骗性。

　　StopThread 中被同步方法的动作即使没有同步也是原子的。换句话说，这些方法的同步只是为了它的通信效果，而不是为了互斥访问。虽然循环的每个迭代中的同步开销很小，还是有其他更正确的替代方法，它更加简洁，性能也可能更好。如果 stopRequested 被声明为 volatile ，第二种版本的 StopThread 中的锁就可以省略。虽然 volatile 修饰符不执行互斥访问，但它可以保证任何一个线程在读取该字段的时候都将看到最近刚刚被写入的值：

// Cooperative thread termination with a volatile field
public class StopThread {
    private static volatile Boolean stopRequested;
    public static void main(String[] args)
            throws InterruptedException {
        Thread backgroundThread = new Thread(() -> {
            int i = 0;
            while (!stopRequested)
                i++;
        });
        backgroundThread.start();
        TimeUnit.SECONDS.sleep(1);
        stopRequested = true;
    }
}

　　在使用 volatile 的时候务必要小心。以下面的方法为例，假设它要产生序列号：

// Broken - requires synchronization!
private static volatile int nextSerialNumber = 0;

public static int generateSerialNumber() {
    return nextSerialNumber++;
}

　　这个方法的目的是要确保每个调用都返回不同的值（只要不超过 2³² 个调用）。这个方法的状态只包含一个可原子访问的字段： nextSerialNumber ，这个字段的所有可能的值都是合法的。因此，不需要任何同步来保护它的约束条件。然而，如果没有同步，这个方法仍然无法正确地工作。

　　问题在于，增量操作符（++）不是原子的。它在 nextSerialNumber 字段中执行两项操作：首先它读取值，然后写回一个新值，相当于原来的值再加上 1。如果第二个线程在第一个线程读取旧值和写回新值期间读取这个字段第二个线程就会与第一个线程一起看到同一个值，并返回相同的序列号。这就是安全性失败（ safety failure ）：这个程序会计算出错误的结果。

　　修正 generateSerialNumber 方法的一种方法是在它的声明中增加 synchronized 修饰符。这样可以确保多个调用不会交叉存取，确保每个调用都会看到之前所有调用的效果。一旦这么做，就可以且应该从 nextSerialNumber 中删除 volatile 修饰符。为了保护这个方法，要用 long 代替 int ，或者在 nextSerialNumber 要进行包装时抛出异常。

　　最好还是遵循第 59 条中的建议，使用 AtomicLong 类，它是 java.util.concurrent.atomic 的组成部分。这个包为在单个变量上进行免锁定、线程安全的编程提供了基本类型。虽然 volatile 只提供了同步的通信效果，但这个包还提供了原子性。这正是你想让 generateSerialNumber 完成的工作，并且它可能比同步版本完成得更好：

// Lock-free synchronization with java.util.concurrent.atomic
private static final Atomiclong nextSerialNum = new Atomiclong();

public static long generateSerialNumber() {
    return nextSerialNum.getAndIncrement();
}

　　避免本条目中所讨论到的问题的最佳办法是不共享可变的数据。要么共享不可变的数据（详见第 17 条），要么压根不共享。换句话说， 将可变数据限制在单个线程中。 如果采用这一策略，对它建立文档就很重要，以便它可以随着程序的发展而得到维护。深刻地理解正在使用的框架和类库也很重要，因为它们引入了你不知道的线程。

　　让一个线程在短时间内修改一个数据对象，然后与其他线程共享，这是可以接受的，它只同步共享对象引用的动作。然后其他线程没有进一步的同步也可以读取对象，只要它没有再被修改。这种对象被称作高效不可变（ effectively immutable ) [Goetz06, 3.5.4] 。将这种对象引用从一个线程传递到其他的线程被称作安全发布（ safe publication) [Goetz06, 3.5.3] 。安全发布对象引用有许多种方法：可以将它保存在静态字段巾，作为类初始化的一部分；可以将它保存在 volatile 字段、final 字段或者通过正常锁定访问的字段中；或者可以将它放到并发的集合中（详见第 81 条）。

　　总而言之， 当多个线程共享可变数据的时候，每个读或者写数据的线程都必须执行同步。 如果没有同步，就无法保证一个线程所做的修改可以被另一个线程获知。未能同步共享可变数据会造成程序的活跃性失败（ liveness failure ）和安全性失败（ safety failure ）。这样的失败是最难调试的。它们可能是间歇性的，且与时间相关，程序的行为在不同的虚拟机上可能根本不同。如果只需要线程之间的交互通信，而不需要互斥， volatile 修饰符就是一种可以接受的同步形式，但要正确地使用它可能需要一些技巧。

0. 介绍

1. 考虑使用静态工厂方法替代构造方法

2. 当构造方法参数过多时使用 builder 模式

3. 使用私有构造方法或枚类实现 Singleton 属性

4. 使用私有构造器执行非实例化

5. 依赖注入优于硬连接资源（hardwiring resources）

6. 避免创建不必要的对象

7. 消除过期的对象引用

8. 避免使用 Finalizer 和 Cleaner 机制

9. 使用 try-with-resources 语句替代 try-finally 语句

10. 重写 equals 方法时遵守通用约定

11. 重写 equals 方法时同时也要重写 hashcode 方法

12. 始终重写 toString 方法

13. 谨慎地重写 clone 方法

14. 考虑实现 Comparable 接口

15. 使类和成员的可访问性最小化

16. 在公共类中使用访问方法而不是公共属性

17. 最小化可变性

18. 组合优于继承

19. 要么设计继承并提供文档说明，要么禁用继承

20. 接口优于抽象类

21. 为后代设计接口

22. 接口仅用来定义类型

23. 类层次结构优于标签类

24. 支持使用静态成员类而不是非静态类

25. 将源文件限制为单个顶级类

26. 不要使用原始类型

27. 消除非检查警告

28. 列表优于数组

29. 优先考虑泛型

30. 优先使用泛型方法

31. 使用限定通配符来增加 API 的灵活性

32. 合理地结合泛型和可变参数

33. 优先考虑类型安全的异构容器

34. 使用枚举类型替代整型常量

35. 使用实例属性替代序数

36. 使用 EnumSet 替代位属性

37. 使用 EnumMap 替代序数索引

38. 使用接口模拟可扩展的枚举

39. 注解优于命名模式

40. 始终使用 Override 注解

41. 使用标记接口定义类型

42. lambda 表达式优于匿名类

43. 方法引用优于 lambda 表达式

44. 优先使用标准的函数式接口

45. 明智审慎地使用 Stream

46. 优先考虑流中无副作用的函数

47. 优先使用 Collection 而不是 Stream 来作为方法的返回类型

48. 谨慎使用流并行

49. 检查参数有效性

50. 必要时进行防御性拷贝

51. 仔细设计方法签名

52. 明智审慎地使用重载

53. 明智审慎地使用可变参数

54. 返回空的数组或集合，不要返回 null

55. 明智审慎地返回 Optional

56. 为所有已公开的 API 元素编写文档注释

57. 最小化局部变量的作用域

58. for-each 循环优于传统 for 循环

59. 了解并使用库

60. 若需要精确答案就应避免使用 float 和 double 类型

61. 基本数据类型优于包装类

62. 当使用其他类型更合适时应避免使用字符串

63. 当心字符串连接引起的性能问题

64. 通过接口引用对象

65. 接口优于反射

66. 明智审慎地本地方法

67. 明智审慎地进行优化

68. 遵守被广泛认可的命名约定

69. 只针对异常的情况下才使用异常

70. 对可恢复的情况使用受检异常，对编程错误使用运行时异常

71. 避免不必要的使用受检异常

72. 优先使用标准的异常

73. 抛出与抽象对应的异常

74. 每个方法抛出的异常都需要创建文档

75. 在细节消息中包含失败一捕获信息

76. 保持失败原子性

77. 不要忽略异常

78. 同步访问共享的可变数据

79. 避免过度同步