多线程的那点儿事(基础篇)

简介:

多线程编程是现代软件技术中很重要的一个环节。要弄懂多线程,这就要牵涉到多进程?当然,要了解到多进程,就要涉及到操作系统。不过大家也不要紧张,听我慢慢道来。这其中的环节其实并不复杂。

  (1)单CPU下的多线程

  在没有出现多核CPU之前,我们的计算资源是唯一的。如果系统中有多个任务要处理的话,那么就需要按照某种规则依次调度这些任务进行处理。什么规则呢?可以是一些简单的调度方法,比如说

  1)按照优先级调度

  2)按照FIFO调度

  3)按照时间片调度等等

  当然,除了CPU资源之外,系统中还有一些其他的资源需要共享,比如说内存、文件、端口、socket等。既然前面说到系统中的资源是有限的,那么获取这些资源的最小单元体是什么呢,其实就是进程。

  举个例子来说,在linux上面每一个享有资源的个体称为task_struct,实际上和我们说的进程是一样的。我们可以看看task_struct(linux 0.11代码)都包括哪些内容

struct task_struct {   /* these are hardcoded - don't touch */       long state; /* -1 unrunnable, 0 runnable, >0 stopped */       long counter;       long priority;       long signal;       struct sigaction sigaction[32];       long blocked;   /* bitmap of masked signals */   /* various fields */       int exit_code;       unsigned long start_code,end_code,end_data,brk,start_stack;       long pid,father,pgrp,session,leader;       unsigned short uid,euid,suid;       unsigned short gid,egid,sgid;       long alarm;       long utime,stime,cutime,cstime,start_time;       unsigned short used_math;   /* file system info */       int tty;        /* -1 if no tty, so it must be signed */       unsigned short umask;       struct m_inode * pwd;       struct m_inode * root;       struct m_inode * executable;       unsigned long close_on_exec;       struct file * filp[NR_OPEN];   /* ldt for this task 0 - zero 1 - cs 2 - ds&ss */       struct desc_struct ldt[3];   /* tss for this task */       struct tss_struct tss;   };

  每一个task都有自己的pid,在系统中资源的分配都是按照pid进行处理的。这也就说明,进程确实是资源分配的主体。

  这时候,可能有朋友会问了,既然task_struct是资源分配的主体,那为什么又出来thread?为什么系统调度的时候是按照thread调度,而不是按照进程调度呢?原因其实很简单,进程之间的数据沟通非常麻烦,因为我们之所以把这些进程分开,不正是希望它们之间不要相互影响嘛。

  假设是两个进程之间数据传输,那么需要如果需要对共享数据进行访问需要哪些步骤呢

  1)创建共享内存

  2)访问共享内存->系统调用->读取数据

  3)写入共享内存->系统调用->写入数据

 要是写个代码,大家可能就更明白了

#include <unistd.h>    #include <stdio.h>       int value = 10;      int main(int argc, char* argv[])   {       int pid = fork();       if(!pid){           Value = 12;           return 0;       }       printf("value = %d\n", value);       return 1;   }

  上面的代码是一个创建子进程的代码,我们发现打印的value数值还是10。尽管中间创建了子进程,修改了value的数值,但是我们发现打印下来的数值并没有发生改变,这就说明了不同的进程之间内存上是不共享的。

  那么,如果修改成thread有什么好处呢?其实最大的好处就是每个thread除了享受单独cpu调度的机会,还能共享每个进程下的所有资源。要是调度的单位是进程,那么每个进程只能干一件事情,但是进程之间是需要相互交互数据的,而进程之间的数据都需要系统调用才能应用,这在无形之中就降低了数据的处理效率。

  (2)多核CPU下的多线程

  没有出现多核之前,我们的CPU实际上是按照某种规则对线程依次进行调度的。在某一个特定的时刻,CPU执行的还是某一个特定的线程。然而,现在有了多核CPU,一切变得不一样了,因为在某一时刻很有可能确实是n个任务在n个核上运行。我们可以编写一个简单的open mp测试一下,如果还是一个核,运行的时间就应该是一样的。

#include <omp.h>    #define MAX_VALUE 10000000       double _test(int value)   {       int index;       double result;          result = 0.0;       for(index = value + 1; index < MAX_VALUE; index +=2 )           result += 1.0 / index;          return result;   }      void test()   {       int index;       int time1;       int time2;       double value1,value2;       double result[2];          time1 = 0;       time2 = 0;          value1 = 0.0;       time1 = GetTickCount();       for(index = 1; index < MAX_VALUE; index ++)           value1 += 1.0 / index;          time1 = GetTickCount() - time1;          value2 = 0.0;       memset(result , 0, sizeof(double) * 2);       time2 = GetTickCount();      #pragma omp parallel for        for(index = 0; index < 2; index++)           result[index] = _test(index);          value2 = result[0] + result[1];       time2 = GetTickCount() - time2;          printf("time1 = %d,time2 = %d\n",time1,time2);       return;   }

  (3)多线程编程

  为什么要多线程编程呢?这其中的原因很多,我们可以举例解决

  1)有的是为了提高运行的速度,比如多核cpu下的多线程

  2)有的是为了提高资源的利用率,比如在网络环境下下载资源时,时延常常很高,我们可以通过不同的thread从不同的地方获取资源,这样可以提高效率

  3)有的为了提供更好的服务,比如说是服务器

  4)其他需要多线程编程的地方等等

本文出自seven的测试人生公众号最新内容请见作者的GitHub页:http://qaseven.github.io/

目录
相关文章
|
5月前
|
安全 Java 编译器
多线程(看这一篇就够了,超详细,满满的干货)
多线程(看这一篇就够了,超详细,满满的干货)
45 2
|
4月前
|
数据处理 开发者 Python
别再盲目编码!一文读懂Python线程与进程的使用场景与限制,助你成为并发编程高手!
【7月更文挑战第8天】Python并发编程提升效率,关键在于理解线程和进程的适用场景。I/O密集型任务如Web服务器适合用线程,示例展示了使用`threading`处理HTTP请求。CPU密集型任务则利用`multiprocessing`创建进程,绕过GIL限制,实现多核利用。注意线程的GIL限制和进程的开销,选择合适模型以优化并发性能。
45 0
|
存储 算法 程序员
进程相关概念(避坑指南-通透多进程开发)
进程相关概念(避坑指南-通透多进程开发)
50 0
|
SQL 缓存 安全
【多线程】——java多线程编程核心读书总结
前段时间学习到多线程相关内容了,看了java多线程编程核心这本书,下面是小编对这本书的总结
涨姿势了!原来这才是多线程正确实现方式
线程同步机制是一套适用于协调线程之间的数据访问机制,该机制可以保障线程安全 java平台提供的线程同步机制包括:锁、volatile关键字、final关键字,static关键字、以及相关API如object.wait/object.notify
|
算法 Java Linux
工作这么久了,还不懂多线程吗?
浩哥Java多线程整理学习系列之01基础知识整理
107 0
工作这么久了,还不懂多线程吗?
|
存储 安全 算法
重生之我在人间敲代码_Java并发基础_安全性、活跃性以及性能问题
并发编程中我们需要注意的问题有很多,很庆幸前人已经帮我们总结过了,主要有三个方面,分别是:安全性问题、活跃性问题和性能问题。
|
监控
【多线程:犹豫模式】
【多线程:犹豫模式】
133 0
|
设计模式 安全 Java
拜托!别再问我多线程的这些问题了
很多同学面对多线程的问题都很头大,因为自己做项目很难用到,但是但凡高薪的职位面试都会问到。。毕竟现在大厂里用的都是多线程高并发,所以这块内容不吃透肯定是不行的。 今天这篇文章,作为多线程的基础篇,先来谈谈以下问题: 为什么要用多线程? 程序 vs 进程 vs 线程 创建线程的 4 种方式?
136 0
拜托!别再问我多线程的这些问题了