Java并发编程与高并发解决方案-阿里云开发者社区

Java并发编程与高并发解决方案

2018-04-23 2111

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 基本概念并发：同时拥有两个或者多个线程，如果程序在单核处理器上运行，多个线程将交替地换入或者换出内存，这些线程是同时“存在”的，每个线程都处于执行过程中的某个状态，高速切换感觉同时执行。

基本概念

并发：同时拥有两个或者多个线程，如果程序在单核处理器上运行，多个线程将交替地换入或者换出内存，这些线程是同时“存在”的，每个线程都处于执行过程中的某个状态，高速切换感觉同时执行。如果运行多核处理器上，此时，程序中的每个线程将分配到一个处理器核上，因此可以真正的同时运行。

高并发：高并发（High Cuncurrency）是互联网分布式系统架构设计中必须考虑的因素之一，它通常是指，通过设计保证系统能够 同时并发处理 很多请求。

其实当我们讨论并发时主要关注的是以下几点：

多线程操作相同的资源
保证线程安全
合理分配和使用资源

而在讨论高并发是关注的是以下几点：

服务器能同时处理很多个请求
提高程序性能

比如在12306抢票，淘宝双11等都需要考虑高并发

cup多级缓存

在单核时代处理器做出的乱序优化不会导致执行结果远离预期目标，但在多核环境下却并非如此。在多核时代，由多核cpu同时执行指令，同时还引入的l1、l2等缓存机制，每个核都有自己的缓存，就导致了逻辑顺序上后写入的数据未必真的最后写入。如果我们不做任何防护措施，就会出现处理器得出的结果和我们逻辑得出的结果大不相同。
比如：我们在一个cpu核心上执行写入操作，并在最后写入一个标记来表示该操作已经写入好了。然后从另外一个核上通过判断这个标记来确定所需要的数据是否已经就绪，这种做法就存在一定风险：标记位先被写入但数据操作并未完成。导致另外一个核使用了错误数据。

Java内存模型（Java Memory Model，JMM）

内存模型可以理解为在特定的操作协议下，对特定的内存或者高速缓存进行读写访问的过程抽象，不同架构下的物理机拥有不一样的内存模型，Java虚拟机也有自己的内存模型，即Java内存模型（Java Memory Model, JMM）。在C/C++语言中直接使用物理硬件和操作系统内存模型，导致不同平台下并发访问出错。而JMM的出现，能够屏蔽掉各种硬件和操作系统的内存访问差异，实现平台一致性，是的Java程序能够“一次编写，到处运行”。

Java线程之间的通信由Java内存模型（本文简称为JMM）控制，JMM决定一个线程对共享变量的写入何时对另一个线程可见。

堆内存（Heap）: 存放实例域, 静态域, 数组元素. 在线程间共享.
栈内存（Stack）: 存放局部变量, 方法定义参数和异常处理器参数.

线程A和线程B要进行通信，必须先将数据刷新到主内存，线程B再从主内存读取线程A更新过的变量。

比如多个线程同时修改一个变量：线程A 先从主内存中获取共享变量（a=2），然后在自己本地内存中计算（a+2），然后写入到主内存。
但此时B也从主内存获取（a=2），在本地内存改变（a+2）.写入到主内存。
在计算过程中两个线程间的数据是不可见的，此时就会出现结果不正确情况。

主内存和工作内存

Java内存模型的主要目标是定义程序中各个变量的访问规则，即在虚拟机中将变量存储到内存和从内存中取出变量这样底层细节。此处的变量与Java编程时所说的变量不一样，指包括了实例字段、静态字段和构成数组对象的元素，但是不包括局部变量与方法参数，后者是线程私有的，不会被共享。

Java内存模型中规定了所有的变量都存储在主内存中，每条线程还有自己的工作内存（可以与前面讲的处理器的高速缓存类比），线程的工作内存中保存了该线程使用到的变量到主内存副本拷贝，线程对变量的所有操作（读取、赋值）都必须在工作内存中进行，而不能直接读写主内存中的变量。不同线程之间无法直接访问对方工作内存中的变量，线程间变量值的传递均需要在主内存来完成，线程、主内存和工作内存的交互关系如下图所示，和上图很类似。

img_9ecea0d911788b31735044de8eec6282.jpe

注意：这里的主内存、工作内存与Java内存区域的Java堆、栈、方法区不是同一层次内存划分，这两者基本上没有关系。

内存交互操作

由上面的交互关系可知，关于主内存与工作内存之间的具体交互协议，即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节，Java内存模型定义了以下八种操作来完成：

lock（锁定）：作用于主内存的变量，把一个变量标识为一条线程独占状态。
unlock（解锁）：作用于主内存变量，把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他线程锁定。
read（读取）：作用于主内存变量，把一个变量值从主内存传输到线程的工作内存中，以便随后的load动作使用
load（载入）：作用于工作内存的变量，它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
use（使用）：作用于工作内存的变量，把工作内存中的一个变量值传递给执行引擎，每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
assign（赋值）：作用于工作内存的变量，它把一个从执行引擎接收到的值赋值给工作内存的变量，每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
store（存储）：作用于工作内存的变量，把工作内存中的一个变量的值传送到主内存中，以便随后的write的操作。
write（写入）：作用于主内存的变量，它把store操作从工作内存中一个变量的值传送到主内存的变量中。

如果要把一个变量从主内存中复制到工作内存，就需要按顺寻地执行read和load操作，如果把变量从工作内存中同步回主内存中，就要按顺序地执行store和write操作。Java内存模型只要求上述两个操作必须按顺序执行，而没有保证必须是连续执行。也就是read和load之间，store和write之间是可以插入其他指令的，如对主内存中的变量a、b进行访问时，可能的顺序是read a，read b，load b， load a。

Java内存模型还规定了在执行上述八种基本操作时，必须满足如下规则：

不允许read和load、store和write操作之一单独出现
不允许一个线程丢弃它的最近assign的操作，即变量在工作内存中改变了之后必须同步到主内存中。
不允许一个线程无原因地（没有发生过任何assign操作）把数据从工作内存同步回主内存中。
一个新的变量只能在主内存中诞生，不允许在工作内存中直接使用一个未被初始化（load或assign）的变量。即就是对一个变量实施use和store操作之前，必须先执行过了assign和load操作。
一个变量在同一时刻只允许一条线程对其进行lock操作，lock和unlock必须成对出现
如果对一个变量执行lock操作，将会清空工作内存中此变量的值，在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值
如果一个变量事先没有被lock操作锁定，则不允许对它执行unlock操作；也不允许去unlock一个被其他线程锁定的变量。
对一个变量执行unlock操作之前，必须先把此变量同步到主内存中（执行store和write操作）。

这8种内存访问操作很繁琐，后文会使用一个等效判断原则，即先行发生（happens-before）原则来确定一个内存访问在并发环境下是否安全。

并发的优势和风险

活跃性问题
- 死锁：哲学家吃饭
  饥饿：餐厅排队吃饭，一个窗口很多人排对象，好多人不自觉插队，导致抢不到饭的人饿死对应到代码中：线程优先级
- 活锁：两个人对面过河，有两座桥，相互礼让，走另外一个桥，但重复相遇导致谁也过不去
- 饥饿与公平：高优先级的线程吞噬所有cpu时间片,导致其他线程被永远堵塞在一个等待队列同步块的状态
  等待的线程永远不会被唤醒也会引发饥饿问题
  如何避免饥饿问题出现？
性能问题
多线程并不一定绝对提供程序效率，要看具体的场景。

例子一: 单核单处理器,开一个线程跑循环输出10万条打印信息,开100个线程输出10万条打印信息.后者比前者慢,因为输出端是临界资源,线程抢占的时间大,单线程则无需抢占
例子二: 网络服务器处理,每个请求开一个线程,请求的处理时间极短,迅速返回,一次提交10万个请求,则有10万次线程创建和销毁对应于一个工作线程处理这10万条请求后者比前者肯定快
注意：多线程并不会提供cpu的执行速度，只是提高了cpu的利用率