嵌入式实践教程--【Linux驱动】Linux驱动开发基于Linux4.0+(二)——并发与同步

简介: 嵌入式实践教程--【Linux驱动】Linux驱动开发基于Linux4.0+(二)——并发与同步

一、概念



所谓并发,是指多个内核路径同时访问和操作数据,可能发生 覆盖共享数据的情况,造成被访问数据的不一致。


在内核中发生并发访问并发源主要有以下4种。


中断和异常


软中断和tasklet:软中断和tasklet可能随时会被调度运行,从而打断当前正在执行进程的上下文。


内核抢占:调度器支持内核抢占。


多处理器并发运行


上述情况需要针对单核和多核系统进行区别对待。


对于单处理器的系统有以下并发源:

1. 中断处理程序可以打断软中断、tasklet和进程上下文的执行

2. 软中断和tasklet并不会并发,但是可以打断进程上下文的执行

3. 在支持抢占的内核中,进程上下文会并发

4. 在不支持抢占的内核中,进程的上下文不会产生并发


对于SMP系统:

1. 同类型的中断并不会并发,但是不同类型的中断源可能会被送到不同的CPU上,因此可能会存在并发

2. 同类型的软中断会在不同的CPU上并发执行

3. 同类型的tasklet是串行执行,不会在多个CPU上并发

4. 不同CPU的进程上下文会并发

记住临界区的保护原则:是保护资源或者数据,而不是保护代码。(静态局部变量,全局变量,共享的数据结构,Buffer缓存,链表,红黑树等)


二、原子操作和内存屏障



1.ARM处理器中如何实现独占访问内存??


处理器中有Local monitor和Global monitor来实现ldrex和strex指令的独占访问,并且ldrex和strex保证的add操作的原子性。


i++用原子操作还是加锁的方式来保证它的原子性??


采用原子操作,加锁开销太大!


2.内存屏障


程序实际运行时内存访问顺序和程序代码编写的访问顺序不一致,会导致内存乱序访问.因此引入内存屏障以防止内存乱序访问.


数据存储屏障DMB(Data Memory Barrier)

数据同步屏障DSB(Data Sync Barrier)

指令同步屏障ISB(Instruction Sync Barrier)


[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IOvOiXLP-1635519975557)(https://i.imgur.com/W9oqnhp.jpg)]


内存屏障的使用场景举例:


在网卡驱动程序中发送数据包,网络数据包写入buffer后交给DMA引擎发送,wmb()保证在DMA传输前,数据被完全写入buffer中.


在内核里的睡眠和唤醒API也用到了内存屏障,在set_current_state()修改进程状态时插入内存屏障函数smp_wmb().唤醒时会调用wake_up(),在修改task状态之前也会隐式的插入smp_wmb()


3.自旋锁spinlock


1.spinlock的性质:

忙等待的所机制

同一时刻只能有一个代码路径获得该锁

锁持有者必须尽快完成临界区的任务


2.存在的问题:

在很多CPU争用同一个spinlock时,会导致严重的不公平性和性能下降。当该锁释放时,事实上可能刚刚释放该锁的CPU又会马上获得该锁的使用权,没有考虑那些已经在锁外面等待了很久的CPU。因为刚刚释放锁的CPU的L1 cache中存储了该锁,它比其他锁更快的获得自旋锁。


3spinlock锁实现的关键:

关闭内核抢占!!!

如果临界区允许内核抢占,那么如果临界区发生中断,中断返回时回去检查抢占调度。


因此就有两个问题:

①抢占调度相当于使得持有锁的进程睡眠,违背了spinlock不允许睡眠和快速执行的设计初衷;

②抢占调度进程也可能去申请获得spinlock锁,于是死锁就产生了。


4.使用spinlock的重要原则:

拥有spinlock锁的临界区必须是原子执行,不能休眠和主动调度。


5.spin_lock和raw_spin_lock的区别

在绝对不允许被抢占和睡眠的临界区,应该使用raw_spin_lock,否则使用spin_lock


4.信号量


信号量的可以同时允许任意数量的锁持有者,sema_init(struct *sem,int count),其中count大于1,可以允许多个持有者,计数信号量;count等于1,只允许一人持有锁,互斥信号量。信号量允许睡眠。可以用于并行处理环境。


5.Mutex互斥体


Linux内核已经有了信号量机制,为何还要单独设置一个Mutex机制呢??


信号量相当于多个厕所;Mutex相当于一个厕所,一次只允许一个人进去。Mutex比信号量执行速度快,可扩展性更好,Mutex数据结构的定义比信号量小。


Mutex实现了自旋等待的机制,更准确的说,他比读写信号量更早的实现了自旋等待机制。在实现自旋等待机制时,内核实现了一套MCS锁机制(一种自旋锁优化方案)来保证只有一个人自旋等待持有者释放锁。


MCS避免多个CPU争用锁导致CPU高速缓存行颠簸现象


1.Mutex锁的实现

Mutex锁的初始化有两种方式:

静态使用DEFINE_MUTEX宏

动态使用mutex_init()函数


小结


Mutex使用场景:


  1. 同一时刻只有一个线程可以持有Mutex
  2. 只有锁持有者可以解锁.
  3. 不允许递归加锁和解锁
  4. 进程持有Mutex不能退出
  5. 必须使用官方API来初始化
  6. 可以睡眠,但是不允许在中断处理程序或中断下半部使用.


在实际工程中,如何使用spinlock和Mutex???


中断上下文,毫不犹豫地使用spinlock,临界区含有睡眠,隐含睡眠的动作及内核API,避免使用spinlock.信号量和Mutex,优先使用Mutex.

相关文章
|
6天前
|
缓存 Linux 开发者
Linux内核中的并发控制机制:深入理解与应用####
【10月更文挑战第21天】 本文旨在为读者提供一个全面的指南,探讨Linux操作系统中用于实现多线程和进程间同步的关键技术——并发控制机制。通过剖析互斥锁、自旋锁、读写锁等核心概念及其在实际场景中的应用,本文将帮助开发者更好地理解和运用这些工具来构建高效且稳定的应用程序。 ####
23 5
|
9天前
|
Linux 数据库
Linux内核中的锁机制:保障并发操作的数据一致性####
【10月更文挑战第29天】 在多线程编程中,确保数据一致性和防止竞争条件是至关重要的。本文将深入探讨Linux操作系统中实现的几种关键锁机制,包括自旋锁、互斥锁和读写锁等。通过分析这些锁的设计原理和使用场景,帮助读者理解如何在实际应用中选择合适的锁机制以优化系统性能和稳定性。 ####
26 6
|
30天前
|
Linux API 开发工具
FFmpeg开发笔记(五十九)Linux编译ijkplayer的Android平台so库
ijkplayer是由B站研发的移动端播放器,基于FFmpeg 3.4,支持Android和iOS。其源码托管于GitHub,截至2024年9月15日,获得了3.24万星标和0.81万分支,尽管已停止更新6年。本文档介绍了如何在Linux环境下编译ijkplayer的so库,以便在较新的开发环境中使用。首先需安装编译工具并调整/tmp分区大小,接着下载并安装Android SDK和NDK,最后下载ijkplayer源码并编译。详细步骤包括环境准备、工具安装及库编译等。更多FFmpeg开发知识可参考相关书籍。
82 0
FFmpeg开发笔记(五十九)Linux编译ijkplayer的Android平台so库
|
2月前
|
存储 Linux 开发工具
如何进行Linux内核开发【ChatGPT】
如何进行Linux内核开发【ChatGPT】
|
3月前
|
Java Linux API
Linux设备驱动开发详解2
Linux设备驱动开发详解
43 6
|
3月前
|
消息中间件 算法 Unix
Linux设备驱动开发详解1
Linux设备驱动开发详解
49 5
|
3月前
|
NoSQL Linux C语言
嵌入式GDB调试Linux C程序或交叉编译(开发板)
【8月更文挑战第24天】本文档介绍了如何在嵌入式环境下使用GDB调试Linux C程序及进行交叉编译。调试步骤包括:编译程序时加入`-g`选项以生成调试信息;启动GDB并加载程序;设置断点;运行程序至断点;单步执行代码;查看变量值;继续执行或退出GDB。对于交叉编译,需安装对应架构的交叉编译工具链,配置编译环境,使用工具链编译程序,并将程序传输到开发板进行调试。过程中可能遇到工具链不匹配等问题,需针对性解决。
|
3月前
|
Ubuntu NoSQL Linux
Linux内核和驱动
Linux内核和驱动
29 2
|
2月前
|
Linux API
Linux里的高精度时间计时器(HPET)驱动 【ChatGPT】
Linux里的高精度时间计时器(HPET)驱动 【ChatGPT】
|
4天前
|
Linux
在 Linux 系统中,“cd”命令用于切换当前工作目录
在 Linux 系统中,“cd”命令用于切换当前工作目录。本文详细介绍了“cd”命令的基本用法和常见技巧,包括使用“.”、“..”、“~”、绝对路径和相对路径,以及快速切换到上一次工作目录等。此外,还探讨了高级技巧,如使用通配符、结合其他命令、在脚本中使用,以及实际应用案例,帮助读者提高工作效率。
22 3