Java多线程初学者指南(9):为什么要进行数据同步

简介:
Java 中的变量分为两类:局部变量和类变量。局部变量是指在方法内定义的变量,如在run 方法中定义的变量。对于这些变量来说,并不存在线程之间共享的问题。因此,它们不需要进行数据同步。类变量是在类中定义的变量,作用域是整个类。这类变量可以被多个线程共享。因此,我们需要对这类变量进行数据同步。
数据同步就是指在同一时间,只能由一个线程来访问被同步的类变量,当前线程访问完这些变量后,其他线程才能继续访问。这里说的访问是指有写操作的访问,如果所有访问类变量的线程都是读操作,一般是不需要数据同步的。
那么如果不对共享的类变量进行数据同步,会发生什么情况呢?让我们先看看下面的代码会发生什么样的事情:
package  test;

public   class  MyThread  extends  Thread
{
    
public   static   int  n  =   0 ;

    
public   void  run()
    {
        
int  m  =  n;
        yield();
        m
++ ;
        n 
=  m;
    }
    
public   static   void  main(String[] args)  throws  Exception
    {
        MyThread myThread 
=   new  MyThread ();
        Thread threads[] 
=   new  Thread[ 100 ];
        
for  ( int  i  =   0 ; i  <  threads.length; i ++ )
            threads[i] 
=   new  Thread(myThread);
        
for  ( int  i  =   0 ; i  <  threads.length; i ++ )
            threads[i].start();
        
for  ( int  i  =   0 ; i  <  threads.length; i ++ )
            threads[i].join();
        System.out.println(
" n =  "   +  MyThread.n);
    }
}

     在执行上面代码的可能结果如下:
     n  =   59
看到这个结果,可能很多读者会感到奇怪。这个程序明明是启动了100 个线程,然后每个线程将静态变量n 1 。最后使用join 方法使这100 个线程都运行完后,再输出这个n 值。按正常来讲,结果应该是n = 100 。可偏偏结果小于100
其实产生这种结果的罪魁祸首就是我们经常提到的“脏数据”。而run方法中的yield() 语句就是产生“脏数据”的始作俑者(不加yield语句也可能会产生“脏数据”,但不会这么明显,只有将100改成更大的数,才会经常产生“脏数据”,在本例中调用yield就是为了放大“脏数据”的效果)。yield 方法的作用是使线程暂停,也就是使调用yield 方法的线程暂时放弃CPU 资源,使CPU 有机会来执行其他的线程。为了说明这个程序如何产生“脏数据”,我们假设只创建了两个线程:thread1 thread2 。由于先调用了thread1 start 方法,因此,thread1 run 方法一般会先运行。当thread1 run 方法运行到第一行(int m = n; )时,将n 的值赋给m 。当执行到第二行的yield 方法后,thread1 就会暂时停止执行,而当thread1 暂停时,thread2 获得了CPU 资源后开始运行(之前thread2 一直处于就绪状态),当thread2 执行到第一行(int m = n;) 时,由于thread1 在执行到yield n 仍然是0 ,因此,thread2 中的m 获得的值也是0 。这样就造成了thread1 thread2 m 获得的都是0 。在它们执行完yield 方法后,都是从0 开始加1 ,因此,无论谁先执行完,最后n 的值都是1 ,只是这个n thread1 thread2 各赋了一遍值。这个过程如下图如示:

也许有人会问,如果只有n++,会产生“脏数据”吗?答案是肯定的。那么n++ 只是一条语句,又如何在执行过程中将CPU 交给其他的线程呢?其实这只是表面现象,n++ 在被Java 编译器编译成中间语言(也叫做字节码)后,并不是一条语言。让我们看看下面的Java 代码将会被编译成什么样的Java 中间语言。
Java 源代码
public   void  run()
{
    n
++ ;
}
被编译后的中间语言代码
   001    public   void  run()
  
002   {
  
003       aload_0         
  
004       dup             
  
005       getfield
  
006       iconst_1        
  
007       iadd            
  
008       putfield       
  
009        return           
  
010   }
大家可以看到在run 方法中只有n++ 一条语句,而在编译后,却有7 条中间语言语句。我们并不需要知道这些语句的功能是什么,只看一下第005 007 008 行语句。在005 行是getfield ,根据它的英文含义可知是要得到某个值,因为这里只有一个n ,所以毫无疑问,是要得到n 的值。而在007 行的iadd 也不难猜测是将这个得到的n 值加1 。在008 行的putfield 的含义我想大家可能已经猜出来了,它负责将这个加1 后的n 再更新回类变量n 。说到这,可能大家还有一个疑惑,执行n++ 时直接将n 1 不就行了,为什么要如此费周折。其实这里涉及到一个Java 内存模型的问题。
Java 的内存模型分为主存储区和工作存储区。主存储区保存了Java 中所有的实例。也就是说,在我们使用new 来建立一个对象后,这个对象及它内部的方法、变量等都保存在这一区域,在MyThread类中 n 就保存在这个区域。主存储区可以被所有线程共享。而工作存储区就是我们前面所讲的线程栈,在这个区域里保存了在run 方法以及run 方法所调用的方法中定义的变量,也就是方法变量。在线程要修改主存储区中的变量时,并不是直接修改这些变量,而是将它们先复制到当前线程的工作存储区,在修改完后,再将这个变量值覆盖主存储区的相应的变量值。
在了解了Java 的内存模型后,就不难理解为什么n++ 也不是原子操作了。它必须经过一个拷贝、加1 和覆盖的过程。这个过程和在MyThread类 中模拟的过程类似。大家可以想象,如果在执行到getfield 时,thread1 由于某种原因被中断,那么就会发生和MyThread类的执行结果 类似的情况。要想彻底解决这个问题,就必须使用某种方法对n进行同步,也就是在同一时间只能有一个线程操作n,这也称为对n的原子操作。





 本文转自 androidguy 51CTO博客,原文链接:http://blog.51cto.com/androidguy/214828,如需转载请自行联系原作者

相关文章
|
6天前
|
Java 程序员 容器
Java中的变量和常量:数据的‘小盒子’和‘铁盒子’有啥不一样?
在Java中,变量是一个可以随时改变的数据容器,类似于一个可以反复打开的小盒子。定义变量时需指定数据类型和名称。例如:`int age = 25;` 表示定义一个整数类型的变量 `age`,初始值为25。 常量则是不可改变的数据容器,类似于一个锁死的铁盒子,定义时使用 `final` 关键字。例如:`final int MAX_SPEED = 120;` 表示定义一个名为 `MAX_SPEED` 的常量,值为120,且不能修改。 变量和常量的主要区别在于变量的数据可以随时修改,而常量的数据一旦确定就不能改变。常量主要用于防止意外修改、提高代码可读性和便于维护。
|
4天前
|
安全 Java 开发者
深入解读JAVA多线程:wait()、notify()、notifyAll()的奥秘
在Java多线程编程中,`wait()`、`notify()`和`notifyAll()`方法是实现线程间通信和同步的关键机制。这些方法定义在`java.lang.Object`类中,每个Java对象都可以作为线程间通信的媒介。本文将详细解析这三个方法的使用方法和最佳实践,帮助开发者更高效地进行多线程编程。 示例代码展示了如何在同步方法中使用这些方法,确保线程安全和高效的通信。
21 9
|
7天前
|
存储 安全 Java
Java多线程编程的艺术:从基础到实践####
本文深入探讨了Java多线程编程的核心概念、应用场景及其实现方式,旨在帮助开发者理解并掌握多线程编程的基本技能。文章首先概述了多线程的重要性和常见挑战,随后详细介绍了Java中创建和管理线程的两种主要方式:继承Thread类与实现Runnable接口。通过实例代码,本文展示了如何正确启动、运行及同步线程,以及如何处理线程间的通信与协作问题。最后,文章总结了多线程编程的最佳实践,为读者在实际项目中应用多线程技术提供了宝贵的参考。 ####
|
4天前
|
监控 安全 Java
Java中的多线程编程:从入门到实践####
本文将深入浅出地探讨Java多线程编程的核心概念、应用场景及实践技巧。不同于传统的摘要形式,本文将以一个简短的代码示例作为开篇,直接展示多线程的魅力,随后再详细解析其背后的原理与实现方式,旨在帮助读者快速理解并掌握Java多线程编程的基本技能。 ```java // 简单的多线程示例:创建两个线程,分别打印不同的消息 public class SimpleMultithreading { public static void main(String[] args) { Thread thread1 = new Thread(() -> System.out.prin
|
6天前
|
存储 缓存 安全
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见
在 Java 编程中,创建临时文件用于存储临时数据或进行临时操作非常常见。本文介绍了使用 `File.createTempFile` 方法和自定义创建临时文件的两种方式,详细探讨了它们的使用场景和注意事项,包括数据缓存、文件上传下载和日志记录等。强调了清理临时文件、确保文件名唯一性和合理设置文件权限的重要性。
16 2
|
6天前
|
Java
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式
Java 8 引入的 Streams 功能强大,提供了一种简洁高效的处理数据集合的方式。本文介绍了 Streams 的基本概念和使用方法,包括创建 Streams、中间操作和终端操作,并通过多个案例详细解析了过滤、映射、归并、排序、分组和并行处理等操作,帮助读者更好地理解和掌握这一重要特性。
13 2
|
7天前
|
Java
JAVA多线程通信:为何wait()与notify()如此重要?
在Java多线程编程中,`wait()` 和 `notify()/notifyAll()` 方法是实现线程间通信的核心机制。它们通过基于锁的方式,使线程在条件不满足时进入休眠状态,并在条件满足时被唤醒,从而确保数据一致性和同步。相比其他通信方式,如忙等待,这些方法更高效灵活。 示例代码展示了如何在生产者-消费者模型中使用这些方法实现线程间的协调和同步。
21 3
|
6天前
|
安全 Java
Java多线程集合类
本文介绍了Java中线程安全的问题及解决方案。通过示例代码展示了使用`CopyOnWriteArrayList`、`CopyOnWriteArraySet`和`ConcurrentHashMap`来解决多线程环境下集合操作的线程安全问题。这些类通过不同的机制确保了线程安全,提高了并发性能。
|
7天前
|
Java
java小知识—进程和线程
进程 进程是程序的一次执行过程,是系统运行的基本单位,因此进程是动态的。系统运行一个程序即是一个进程从创建,运行到消亡的过程。简单来说,一个进程就是一个执行中的程序,它在计算机中一个指令接着一个指令地执行着,同时,每个进程还占有某些系统资源如CPU时间,内存空间,文件,文件,输入输出设备的使用权等等。换句话说,当程序在执行时,将会被操作系统载入内存中。 线程 线程,与进程相似,但线程是一个比进程更小的执行单位。一个进程在其执行的过程中产生多个线程。与进程不同的是同类的多个线程共享同一块内存空间和一组系统资源,所以系统在产生一个线程,或是在各个线程之间做切换工作时,负担要比
17 1
|
8天前
|
安全 Java 测试技术
Java并行流陷阱:为什么指定线程池可能是个坏主意
本文探讨了Java并行流的使用陷阱,尤其是指定线程池的问题。文章分析了并行流的设计思想,指出了指定线程池的弊端,并提供了使用CompletableFuture等替代方案。同时,介绍了Parallel Collector库在处理阻塞任务时的优势和特点。

热门文章

最新文章