Linux芯片级移植与底层驱动(基于3.7.4内核) --内核节拍

简介:

宋宝华 Barry Song <21cnbao@gmail.com>

新浪微博: @宋宝华Barry

 

1.    SoC Linux底层驱动的组成和现状

为了让Linux在一个全新的ARM SoC上运行,需要提供大量的底层支撑,如定时器节拍、中断控制器、SMP启动、CPU hotplug以及底层的GPIOclockpinctrlDMA硬件的封装等。定时器节拍、中断控制器、SMP启动和CPU hotplug这几部分相对来说没有像早期GPIOclockpinctrlDMA的实现那么杂乱,基本上有个固定的套路。定时器节拍为Linux基于时间片的调度机制以及内核和用户空间的定时器提供支撑,中断控制器的驱动则使得Linux内核的工程师可以直接调用local_irq_disable()disable_irq()等通用的中断API,而SMP启动支持则用于让SoC内部的多个CPU核都投入运行,CPU hotplug则运行运行时挂载或拔除CPU。这些工作,在Linux 3.7内核中,进行了良好的层次划分和架构设计。

GPIOclockpinctrlDMA驱动方面,Linux 2.6时代,内核已或多或少有GPIOclock等底层驱动的架构,但是核心层的代码太薄弱,各SoC对这些基础设施实现方面存在巨大差异,而且每个SoC仍然需要实现大量的代码。pinctrlDMA则最为混乱,几乎各家公司都定义了自己的独特的实现和API

社区必须改变这种局面,于是内核社区在20112012年进行了如下工作,这些工作在目前的3.7内核中基本准备就绪:

§  ST-Ericsson的工程师Linus Walleij提供了新的pinctrl驱动架构,内核新增加一个drivers/pinctrl目录,支撑SoC上的引脚复用,各个SoC的实现代码统一放入该目录;

§  TI的工程师Mike Turquette提供了common clk框架,让具体SoC实现clk_ops成员函数并通过clk_registerclk_register_clkdev注册时钟源以及源与设备对应关系,具体的clock驱动都统一迁移到drivers/clk目录;

§  建议各SoC统一采用dmaengine架构实现DMA驱动,该架构提供了通用的DMA通道APIdmaengine_prep_slave_single()dmaengine_submit()等,要求SoC实现dma_device的成员函数 ,实现代码统一放入drivers/dma目录;

§  GPIO方面,drivers/gpio下的gpiolib已能与新的pinctrl完美共存,实现引脚的GPIO和其他功能之间的复用,具体的SoC只需实现通用的gpio_chip结构体的成员函数。

经过以上工作,基本上就把芯片底层的基础架构方面的驱动的架构统一了,实现方法也统一了。另外,目前GPIOclockpinmux等功能都能良好的进行Device Tree的映射处理,譬如我们可以方面的在.dts中定义一个设备要的时钟、pinmux引脚以及GPIO

除了上述基础设施以外,在将Linux移植入新的SoC过程中,工程师常常强烈依赖于早期的printk功能,内核则提供了相关的DEBUG_LLEARLY_PRINTK支持,只需要SoC提供商实现少量的callback或宏。

本文主要对上述各个组成部分进行架构上的剖析以及关键的实现部分的实例分析,以求完整归纳将Linux移植入新SoC的主要工作。本文基于3.7.4内核。

2.    用于操作系统节拍的timer驱动

Linux 2.6的早期(2.6.21之前)基于tick设计,一般SoC公司在将Linux移植到自己的芯片上的时候,会从芯片内部找一个定时器,并将该定时器配置会HZ的频率,在每个时钟节拍到来时,调用ARM Linux内核核心层的timer_tick()函数,从而引发系统里的一系列行为。如2.6.17arch/arm/mach-s3c2410/time.c的做法是:

127/*

 128 * IRQ handler for the timer

 129 */

 130static irqreturn_t

 131s3c2410_timer_interrupt(int irq, void *dev_id, struct pt_regs *regs)

 132{

 133        write_seqlock(&xtime_lock);

 134        timer_tick(regs);

 135        write_sequnlock(&xtime_lock);

 136        return IRQ_HANDLED;

 137}

 138

 139static struct irqaction s3c2410_timer_irq = {

 140        .name           = "S3C2410 Timer Tick",

 141        .flags          = SA_INTERRUPT | SA_TIMER,

 142        .handler        = s3c2410_timer_interrupt,

 143};

 

252static void __init s3c2410_timer_init (void)

 253{

 254        s3c2410_timer_setup();

 255        setup_irq(IRQ_TIMER4, &s3c2410_timer_irq);

 256}

 257

当前Linux多采用tickless方案,并支持高精度定时器,内核的配置一般会使能NO_HZ(即tickless,或者说动态tick)和HIGH_RES_TIMERS。要强调的是tickless并不是说系统中没有时钟节拍了,而是说这个节拍不再像以前那样,周期性地产生。Tickless意味着,根据系统的运行情况,以事件驱动的方式动态决定下一个tick在何时发生。如果画一个时间轴,周期节拍的系统tick中断发生的时序看起来如下:


NO_HZLinux看起来则是,2次定时器中断发生的时间间隔可长可短:


在当前的Linux系统中,SoC底层的timer被实现为一个clock_event_deviceclocksource形式的驱动。在clock_event_device结构体中,实现其set_mode()set_next_event()成员函数;在clocksource结构体中,主要实现read()成员函数。而定时器中断服务程序中,不再调用timer_tick(),而是调用clock_event_deviceevent_handler()成员函数。一个典型的SoC的底层tick定时器驱动形如:

  61static irqreturn_t xxx_timer_interrupt(int irq, void *dev_id)

  62{

  63        struct clock_event_device *ce = dev_id;

  65        

  70        ce->event_handler(ce);

  71

  72        return IRQ_HANDLED;

  73}

  74

  75/* read 64-bit timer counter */

  76static cycle_t xxx_timer_read(struct clocksource *cs)

  77{

  78        u64 cycles;

  79

  80        /* read the 64-bit timer counter */

  81        cycles = readl_relaxed(xxx_timer_base + XXX_TIMER_LATCHED_HI);

  83        cycles = (cycles << 32) | readl_relaxed(xxx_timer_base + XXX_TIMER_LATCHED_LO);

  84

  85        return cycles;

  86}

  87

  88static int xxx_timer_set_next_event(unsigned long delta,

  89        struct clock_event_device *ce)

  90{

  91        unsigned long now, next;

  92

  93        writel_relaxed(XXX_TIMER_LATCH_BIT, xxx_timer_base + XXX_TIMER_LATCH);

  94        now = readl_relaxed(xxx_timer_base + XXX_TIMER_LATCHED_LO);

  95        next = now + delta;

  96        writel_relaxed(next, xxx_timer_base + SIRFSOC_TIMER_MATCH_0);

  97        writel_relaxed(XXX_TIMER_LATCH_BIT, xxx_timer_base + XXX_TIMER_LATCH);

  98        now = readl_relaxed(xxx_timer_base + XXX_TIMER_LATCHED_LO);

  99

 100        return next - now > delta ? -ETIME : 0;

 101}

 102

 103static void xxx_timer_set_mode(enum clock_event_mode mode,

 104        struct clock_event_device *ce)

 105{

 107        switch (mode) {

 108        case CLOCK_EVT_MODE_PERIODIC:

 109                

 111        case CLOCK_EVT_MODE_ONESHOT:

 112                

 114        case CLOCK_EVT_MODE_SHUTDOWN:

 115                

 117        case CLOCK_EVT_MODE_UNUSED:

 118        case CLOCK_EVT_MODE_RESUME:

 119                break;

 120        }

 121}

 144static struct clock_event_device xxx_clockevent = {

 145        .name = "xxx_clockevent",

 146        .rating = 200,

 147        .features = CLOCK_EVT_FEAT_ONESHOT,

 148        .set_mode = xxx_timer_set_mode,

 149        .set_next_event = xxx_timer_set_next_event,

 150};

 151

 152static struct clocksource xxx_clocksource = {

 153        .name = "xxx_clocksource",

 154        .rating = 200,

 155        .mask = CLOCKSOURCE_MASK(64),

 156        .flags = CLOCK_SOURCE_IS_CONTINUOUS,

 157        .read = xxx_timer_read,

 158        .suspend = xxx_clocksource_suspend,

 159        .resume = xxx_clocksource_resume,

 160};

 161

 162static struct irqaction xxx_timer_irq = {

 163        .name = "xxx_tick",

 164        .flags = IRQF_TIMER,

 165        .irq = 0,

 166        .handler = xxx_timer_interrupt,

 167        .dev_id = &xxx_clockevent,

 168};

 169

 176static void __init xxx_clockevent_init(void)

 177{

 178        clockevents_calc_mult_shift(&xxx_clockevent, CLOCK_TICK_RATE, 60);

 179

 180        xxx_clockevent.max_delta_ns =

 181                clockevent_delta2ns(-2, &xxx_clockevent);

 182        xxx_clockevent.min_delta_ns =

 183                clockevent_delta2ns(2, &xxx_clockevent);

 184

 185        xxx_clockevent.cpumask = cpumask_of(0);

 186        clockevents_register_device(&xxx_clockevent);

 187}

 188

 189/* initialize the kernel jiffy timer source */

 190static void __init xxx_timer_init(void)

 191{

 192        

 214

 215        BUG_ON(clocksource_register_hz(&xxx_clocksource, CLOCK_TICK_RATE));

 218

 219        BUG_ON(setup_irq(xxx_timer_irq.irq, &xxx_timer_irq));

 220

 221        xxx_clockevent_init();

 222}

 249struct sys_timer xxx_timer = {

 250        .init = xxx_timer_init,

 251};

上述代码中,我们特别关注其中的如下函数:

clock_event_deviceset_next_event 成员函数xxx_timer_set_next_event()

该函数的delta参数是Linux内核传递给底层定时器的一个差值,它的含义是下一次tick中断产生的硬件定时器中计数器counter的值相对于当前counter的差值。我们在该函数中将硬件定时器设置为在“当前counter计数值” + delta的时刻产生下一次tick中断。xxx_clockevent_init()函数中设置了可接受的最小和最大delta值对应的纳秒数,即xxx_clockevent.min_delta_nsxxx_clockevent.max_delta_ns

clocksource read成员函数xxx_timer_read()

该函数可读取出从开机以来到当前时刻定时器计数器已经走过的值,无论有没有设置计数器达到某值的时候产生中断,硬件的计数总是在进行的。因此,该函数给Linux系统提供了一个底层的准确的参考时间。

定时器的中断服务程序xxx_timer_interrupt()

在该中断服务程序中,直接调用clock_event_deviceevent_handler()成员函数,event_handler()成员函数的具体工作也是Linux内核根据Linux内核配置和运行情况自行设置的。

clock_event_deviceset_mode成员函数 xxx_timer_set_mode()

用于设置定时器的模式以及resumeshutdown等功能,目前一般采用ONESHOT模式,即一次一次产生中断。当然新版的Linux也可以使用老的周期性模式,如果内核编译的时候未选择NO_HZ,该底层的timer驱动依然可以为内核的运行提供支持。

这些函数的结合,使得ARM Linux内核底层所需要的时钟得以运行。下面举一个典型的场景,假定定时器的晶振时钟频率为1MHz(即计数器每加1等于1us),应用程序透过nanosleep() API睡眠100us,内核会据此换算出下一次定时器中断的delta值为100,并间接调用到xxx_timer_set_next_event()去设置硬件让其在100us后产生中断。100us后,中断产生,xxx_timer_interrupt()被调用,event_handler()会间接唤醒睡眠的进程导致nanosleep()函数返回,从而用户进程继续。

这里特别要强调的是,对于多核处理器来说,一般的做法是给每个核分配一个独立的定时器,各个核根据自身的运行情况动态设置自己时钟中断发生的时刻。看看我们说运行的电脑的local timer中断即知:

barry@barry-VirtualBox:~$ cat /proc/interrupts

           CPU0       CPU1       CPU2       CPU3      

 

 20:        945          0          0          0   IO-APIC-fasteoi   vboxguest

 21:       4456          0          0      21592   IO-APIC-fasteoi   ahci, Intel 82801AA-ICH

 22:         26          0          0          0   IO-APIC-fasteoi   ohci_hcd:usb2

NMI:          0          0          0          0   Non-maskable interrupts

LOC:     177279     177517     177146     177139   Local timer interrupts

SPU:          0          0          0          0   Spurious interrupts

PMI:          0          0          0          0   Performance monitoring

而比较低效率的方法则是只给CPU0提供定时器,由CPU0将定时器中断透过IPIInter Processor Interrupt,处理器间中断)广播到其他核。对于ARM来讲,1IPIIPI_TIMER就是来负责这个广播的,从arch/arm/kernel/smp.c可以看出:

62 enum ipi_msg_type {

 63         IPI_WAKEUP,

 64         IPI_TIMER,

 65         IPI_RESCHEDULE,

 66         IPI_CALL_FUNC,

 67         IPI_CALL_FUNC_SINGLE,

 68         IPI_CPU_STOP,

 69 };





 本文转自 21cnbao 51CTO博客,原文链接:http://blog.51cto.com/21cnbao/1127016,如需转载请自行联系原作者


相关文章
|
1月前
|
安全 Linux 测试技术
Intel Linux 内核测试套件-LKVS介绍 | 龙蜥大讲堂104期
《Intel Linux内核测试套件-LKVS介绍》(龙蜥大讲堂104期)主要介绍了LKVS的定义、使用方法、测试范围、典型案例及其优势。LKVS是轻量级、低耦合且高代码覆盖率的测试工具,涵盖20多个硬件和内核属性,已开源并集成到多个社区CICD系统中。课程详细讲解了如何使用LKVS进行CPU、电源管理和安全特性(如TDX、CET)的测试,并展示了其在实际应用中的价值。
|
1月前
|
Ubuntu Linux 开发者
Ubuntu20.04搭建嵌入式linux网络加载内核、设备树和根文件系统
使用上述U-Boot命令配置并启动嵌入式设备。如果配置正确,设备将通过TFTP加载内核和设备树,并通过NFS挂载根文件系统。
100 15
|
2月前
|
算法 Linux
深入探索Linux内核的内存管理机制
本文旨在为读者提供对Linux操作系统内核中内存管理机制的深入理解。通过探讨Linux内核如何高效地分配、回收和优化内存资源,我们揭示了这一复杂系统背后的原理及其对系统性能的影响。不同于常规的摘要,本文将直接进入主题,不包含背景信息或研究目的等标准部分,而是专注于技术细节和实际操作。
|
2月前
|
存储 缓存 网络协议
Linux操作系统的内核优化与性能调优####
本文深入探讨了Linux操作系统内核的优化策略与性能调优方法,旨在为系统管理员和高级用户提供一套实用的指南。通过分析内核参数调整、文件系统选择、内存管理及网络配置等关键方面,本文揭示了如何有效提升Linux系统的稳定性和运行效率。不同于常规摘要仅概述内容的做法,本摘要直接指出文章的核心价值——提供具体可行的优化措施,助力读者实现系统性能的飞跃。 ####
|
2月前
|
缓存 监控 网络协议
Linux操作系统的内核优化与实践####
本文旨在探讨Linux操作系统内核的优化策略与实际应用案例,深入分析内核参数调优、编译选项配置及实时性能监控的方法。通过具体实例讲解如何根据不同应用场景调整内核设置,以提升系统性能和稳定性,为系统管理员和技术爱好者提供实用的优化指南。 ####
|
2月前
|
监控 算法 Linux
Linux内核锁机制深度剖析与实践优化####
本文作为一篇技术性文章,深入探讨了Linux操作系统内核中锁机制的工作原理、类型及其在并发控制中的应用,旨在为开发者提供关于如何有效利用这些工具来提升系统性能和稳定性的见解。不同于常规摘要的概述性质,本文将直接通过具体案例分析,展示在不同场景下选择合适的锁策略对于解决竞争条件、死锁问题的重要性,以及如何根据实际需求调整锁的粒度以达到最佳效果,为读者呈现一份实用性强的实践指南。 ####
|
2月前
|
负载均衡 算法 Linux
深入探索Linux内核调度机制:公平与效率的平衡####
本文旨在剖析Linux操作系统内核中的进程调度机制,特别是其如何通过CFS(完全公平调度器)算法实现多任务环境下资源分配的公平性与系统响应速度之间的微妙平衡。不同于传统摘要的概览性质,本文摘要将直接聚焦于CFS的核心原理、设计目标及面临的挑战,为读者揭开Linux高效调度的秘密。 ####
55 3
|
8天前
|
Linux
Linux系统之whereis命令的基本使用
Linux系统之whereis命令的基本使用
50 23
Linux系统之whereis命令的基本使用
|
22天前
|
网络协议 Unix Linux
深入解析:Linux网络配置工具ifconfig与ip命令的全面对比
虽然 `ifconfig`作为一个经典的网络配置工具,简单易用,但其功能已经不能满足现代网络配置的需求。相比之下,`ip`命令不仅功能全面,而且提供了一致且简洁的语法,适用于各种网络配置场景。因此,在实际使用中,推荐逐步过渡到 `ip`命令,以更好地适应现代网络管理需求。
34 11
|
2月前
|
Linux
linux查看目录下的文件夹命令,find查找某个目录,但是不包括这个目录本身?
通过本文的介绍,您应该对如何在 Linux 系统中查看目录下的文件夹以及使用 `find` 命令查找特定目录内容并排除该目录本身有了清晰的理解。掌握这些命令和技巧,可以大大提高日常文件管理和查找操作的效率。 在实际应用中,灵活使用这些命令和参数,可以帮助您快速定位和管理文件和目录,满足各种复杂的文件系统操作需求。
143 8