一、操作系统基本概念
操作系统和内核是同义词。
操作系统必须完成两个主要目标:
1、与硬件部分交互,为包含在硬件平台上的所有低层可编程部件服务。
2、为运行在计算机系统上的应用程序(即所谓用户程序)提供执行环境。
1.1、多用户系统
多用户系统就是一台能并发和独立地执行分别属于两个或多个用户的若干应用程序的计算机。
“并发”意味着几个应用程序能同时处于活动状态并竞争各种资源。“独立”意味着每个应用程序能执行自己的任务,而无需考虑其他用户的应用程序在干些什么。
1.2、用户和组
操作系统必须保证用户空间的私有部分仅仅对其拥有者是可见的。特别是必须保证,没有用户能够开发一个用于侵犯其他用户私有空间的系统应用程序。
1.3、进程
进程(process):程序执行时的一个实例,或者叫一个运行程序的“执行上下文”。
区分程序和进程是非常重要的:几个进程能并发地执行同一程序,而同一个进程能顺序地执行几个程序。
在单处理器系统上,只有一个进程能占用CPU,因此,在某一时刻只能有一个执行流。一般来说,CPU的个数总是有限的,因而只有少数几个进程能同时执行。操作系统中叫调度程序(scheduler)的部分决定哪个进程能执行。多用户系统中的进程必须是抢占式的,操作系统记录下每个进程占有CPU的时间,并周期性地激活调度程序。
1.4、内核体系结构
二、Unix文件系统概述
2.1、文件
Unix文件是以字节序列组成的信息载体(container)。
2.1.1、Linux各文件夹的作用
通常情况下,根文件系统所占空间一般应该比较小,因为其中的绝大部分文件都不需要经常改动,而且包括严格的文件和一个小的不经常改变的文件系统不容易损坏。除了可能的一个叫/ v m l i n u z标准的系统引导映像之外,根目录一般不含任何文件。所有
其他文件在根文件系统的子目录中。
1、/bin目录
/ bin目录包含了引导启动所需的命令或普通用户可能用的命令(可能在引导启动后)。这些命令都是二进制文件的可执行程序( bin是binary - -二进制的简称),多是系统中重要的系统文件。
2、/sbin目录
/sbin目录类似/bin,也用于存储二进制文件。因为其中的大部分文件多是系统管理员使用的基本的系统程序,所以虽然普通用户必要且允许时可以使用,但一般不给普通用户使用。
3、/etc目录
/etc目录存放着各种系统管理和配置文件,其中包括了用户信息文件/etc/passwd,系统初始化文件/etc/rc等。
/etc/rc.d 启动的配置文件和脚本
1) /etc/rc或/etc/rc.d或/etc/rc?.d
启动、或改变运行级时运行的脚本或脚本的目录。
2) /etc/passwd
用户数据库,其中的域给出了用户名、真实姓名、用户起始目录、加密口令和用户的其他信息。
3) /etc/fdprm
软盘参数表,用以说明不同的软盘格式。可用setfdprm进行设置。更多的信息见setfdprm的帮助页。
4) /etc/fstab
指定启动时需要自动安装的文件系统列表。也包括用swapon -a启用的s w a p区的信息。
5) /etc/group
类似/etc/passwd ,但说明的不是用户信息而是组的信息。包括组的各种数据。
6) /etc/inittab
init 的配置文件。
7) /etc/issue
包括用户在登录提示符前的输出信息。通常包括系统的一段短说明或欢迎信息。具体内容由系统管理员确定。
8) /etc/magic
“f i l e”的配置文件。包含不同文件格式的说明,“f i l e”基于它猜测文件类型。
9) /etc/motd
motd是message of the day的缩写,用户成功登录后自动输出。内容由系统管理员确定。 常用于通告信息,如计划关机时间的警告等。
10) /etc/mtab
当前安装的文件系统列表。由脚本(scritp)初始化,并由mount 命令自动更新。当需要一个当前安装的文件系统的列表时使用(例如df 命令)。
11) /etc/shadow
在安装了影子(shadow)口令软件的系统上的影子口令文件。影子口令文件将/etc/passwd文件中的加密口令移动到/etc/shadow中,而后者只对超级用户(root)可读。这使破译口令更困难,以此增加系统的安全性。
12) /etc/login.defs
login命令的配置文件。
13) /etc/printcap
类似/etc/termcap ,但针对打印机。语法不同。
14) /etc/profile 、/etc/csh.login、/etc/csh.cshrc
登录或启动时bourne或cshells执行的文件。这允许系统管理员为所有用户建立全局缺省环境。
15) /etc/securetty
确认安全终端,即哪个终端允许超级用户(root)登录。一般只列出虚拟控制台,这样就不可能(至少很困难)通过调制解调器(modem)或网络闯入系统并得到超级用户特权。
16) /etc/shells
列出可以使用的shell。chsh 命令允许用户在本文件指定范围内改变登录的shell。提供一台机器f t p服务的服务进程ftpd 检查用户shell是否列在/etc/shells 文件中,如果不是,将不允许该用户登录。
17) /etc/termcap
终端性能数据库。说明不同的终端用什么“转义序列”控制。写程序时不直接输出转义序列(这样只能工作于特定品牌的终端),而是从/etc/termcap 中查找要做的工作的正确序列。这样,多数的程序可以在多数终端上运行。
4、/root目录
/root 目录是超级用户的目录。
5、/lib目录
/lib目录是根文件系统上的程序所需的共享库,存放了根文件系统程序运行所需的共享文 件。这些文件包含了可被许多程序共享的代码,以避免每个程序都包含有相同的子程序的副 本,故可以使得可执行文件变得更小,节省空间。
6、/lib/modules目录
/lib/modules 目录包含系统核心可加载各种模块,尤其是那些在恢复损坏的系统时重新引导系统所需的模块(例如网络和文件系统驱动)。
7、/dev目录
/dev目录存放了所有的设备文件,即设备驱动程序,用户通过这些文件访问外部设备。比如,用户可以通过访问/dev/mouse来访问鼠标的输入,就像访问其他文件一样。
下面简要介绍/ d e v下一些常用文件。
1) /dev/console
系统控制台,也就是直接和系统连接的监视器。
2) /dev/hd
ide硬盘驱动程序接口。如: /dev/hda指的是第一个硬盘, had1则是指/dev/hda的第一个分区。如系统中有其他的硬盘,则依次为/dev /hdb、/dev/hdc、. . . . . .;如有多个分区则依次为hda1、hda2 . . . . . .
3) /dev/sd
scsi磁盘驱动程序接口。如有系统有scsi硬盘,就不会访问/dev/had,而会访问/dev/sda。
4) /dev/fd
软驱设备驱动程序。如:/dev/fd0指系统的第一个软盘,也就是通常所说的a:盘,/dev/fd1指第二个软盘,. . . . . .而/dev/fd1 h1440则表示访问驱动器1中的4.5高密盘。
5) /dev/st
scsi磁带驱动器驱动程序。
6) /dev/tty
提供虚拟控制台支持。如: /dev/tty1指的是系统的第一个虚拟控制台, /dev/tty2则是系统的第二个虚拟控制台。
7) /dev/pty
提供远程登陆伪终端支持。在进行te l n e t登录时就要用到/dev /pty设备。
8) /dev/ttys
计算机串行接口,对于dos来说就是“ com1”口。
9)/dev/cua
计算机串行接口,与调制解调器一起使用的设备。
10) /dev/null
“黑洞”,所有写入该设备的信息都将消失。例如:当想要将屏幕上的输出信息隐藏起来 时,只要将输出信息输入到/dev/null中即可。
8、/tmp目录
/tmp 目录存放程序在运行时产生的信息和数据。但在引导启动后,运行的程序最好使用/var/tmp来代替/tmp ,因为前者可能拥有一个更大的磁盘空间。
9、/boot目录
/boot目录存放引导加载器(bootstrap loader)使用的文件,如lilo,核心映像也经常放在这里,而不是放在根目录中。但是如果有许多核心映像,这个目录就可能变得很大,这时使用单独的 文件系统会更好一些。还有一点要注意的是,要确保核心映像必须在ide硬盘的前1024柱面内。
10、/mnt目录
/mnt目录是系统管理员临时安装(mount)文件系统的安装点。程序并不自动支持安装到 /mnt 。/mnt 下面可以分为许多子目录,例如/mnt/dosa 可能是使用msdos文件系统的软驱,而/mnt/exta 可能是使用e x t 2文件系统的软驱,/mnt/cdrom 光驱等等。
11、/usr目录
/usr 是个很重要的目录,通常这一文件系统很大,因为所有程序安装在这里。/usr 里的所有文件一般来自linux发行版(distribution);本地安装的程序和其他东西在/usr/local 下,因为这样可以在升级新版系统或新发行版时无须重新安装全部程序。/usr 目录下的许多内容是可选的,但这些功能会使用户使用系统更加有效。/ u s r可容纳许多大型的软件包和它们的配置文件。下面列出一些重要的目录(一些不太重要的目录被省略了)。
12、/var文件系统
/var 包含系统一般运行时要改变的数据。通常这些数据所在的目录的大小是要经常变化或扩充的。原来/var目录中有些内容是在/usr中的,但为了保持/usr目录的相对稳定,就把那些需要经常改变的目录放到/var中了。每个系统是特定的,即不通过网络与其他计算机共享。
13、/proc文件系统
/proc 文件系统是一个伪的文件系统,就是说它是一个实际上不存在的目录,因而这是一个非常特殊的目录。它并不存在于某个磁盘上,而是由核心在内存中产生。这个目录用于提供关于系统的信息。下面说明一些最重要的文件和目录(/proc 文件系统在proc man页中有更详细的说明)。
1) /proc/x
关于进程x的信息目录,这一x是这一进程的标识号。每个进程在/proc 下有一个名为自己进程号的目录。
2) /proc/cpuinfo
存放处理器(cpu)的信息,如cpu的类型、制造商、型号和性能等。
3) /proc/devices
当前运行的核心配置的设备驱动的列表。
4) /proc/dma
显示当前使用的d m a通道。
5) /proc/filesystems
核心配置的文件系统信息。
6) /proc/interrupts
显示被占用的中断信息和占用者的信息,以及被占用的数量。
7) /proc/ioports
当前使用的i / o端口。
8) /proc/kcore
系统物理内存映像。与物理内存大小完全一样,然而实际上没有占用这么多内存;它仅仅是在程序访问它时才被创建。(注意:除非你把它拷贝到什么地方,否则/proc 下没有任何东西占用任何磁盘空间。)
9) /proc/kmsg
核心输出的消息。也会被送到syslog。
10) /proc/ksyms
核心符号表。
11) /proc/loadavg
系统“平均负载”; 3个没有意义的指示器指出系统当前的工作量。
12) /proc/meminfo
各种存储器使用信息,包括物理内存和交换分区(swap)。
13) /proc/modules
存放当前加载了哪些核心模块信息。
14) /proc/net
网络协议状态信息。
15) /proc/self
存放到查看/proc 的程序的进程目录的符号连接。当2个进程查看/proc 时,这将会是不同的连接。这主要便于程序得到它自己的进程目录。
16) /proc/stat
系统的不同状态,例如,系统启动后页面发生错误的次数。
17) /proc/uptime
系统启动的时间长度。
18) /proc/version
核心版本。
14、/home
/home 用户主目录的基点,比如用户user的主目录就是/home/user,可以用~user表示。
15、/lost+found
/lost+found这个目录平时是空的,系统非正常关机而留下“无家可归”的文件(windows下叫什么.chk)就在这里。
2.2、硬链接和软链接
包含在目录中的文件名就是一个文件的硬链接(hard link),或简称链接(Link)。在同一目录或不同的目录中,同一文件可以有几个链接。
硬链接有两个限制:
1、不允许用户给目录创建硬链接。
2、只有在同一文件系统中的文件之间才能创建链接。
软链接(soft link):这些文件包含有另一个文件的任意一个路径名。路径名可以指向位于任意一个文件系统的任意文件或目录,甚至可以指向一个不存在的文件。
2.3、文件类型
2.4、文件描述符与索引节点
2.5、访问权限和文件模式
访问权限:读、写及执行。
2.6、文件操作的系统调用
2.6.1、打开文件
fd = open(path, flag, mode)
三、Unix内核概述
Unix内核提供了应用程序可以运行的执行环境。
3.1、进程/内核模式
CPU即可以运行在用户态下,也可以运行在内核态下。
当一个程序在用户态下执行时,它不能直接访问内核数据结构或内核的程序。
3.2、进程实现
每个进程由一个进程描述符表述,这个描述符包含有关进程当前状态的信息。当内核暂停一个进程的执行时,就把几个相关处理器寄存器的内容保存在进程描述符中。当内核决定恢复执行一个进程时,它用进程描述符中合适的字段来装载CPU寄存器。因为程序计数器中所存的值指向下一条将要执行的指令,所以进程从它停止的地方恢复执行。
当一个进程不在CPU上执行时,它正在等待某一时间。Unix内核可以区分很多等待状态,这些等待状态通常由进程描述符队列实现,每个(可能为空)队列对应一组等待特定事件的进程。
3.3、可重入内核
所有的Unix内核都是可重入的(reentrant),这意味着若干个进程可以同时在内核态下执行。当然,在单处理器系统上只有一个进程在真正执行,但是有许多进程可能在等待CPU或某一I/O操作完成时在内核态下被阻塞。
3.4、进程地址空间
如果同一文件由几个进程共享,那么共享它的每个进程地址空间都包含有它的内存映射。
3.5、同步和临界区
临界区是这样的一段代码,进入这段代码的进程必须完成,之后另一个进程才能进入。
3.5.1、非抢占式内核
当进程在内核态执行时,它不能被任意挂起,也不能被另一个进程代替,因此在单处理器系统上,中断或异常处理程序不能修改所有内核数据结构,内核对它们的访问都是安全的。
如果内核支持抢占,那么在应用同步机制时,确保进入临界区前禁止抢占,退出临界区时启用抢占。
3.5.2、禁止中断
进入一个临界区之前禁止所有硬件中断,离开时再重新启用中断。
3.5.3、信号量
每个要保护的数据结构都有它自己的信号量,其初始值为1.当内核控制路径希望访问这个数据结构时,它在相应的信号量上执行down()方法。如果信号量的当前值不是负值,则允许访问这个数据结构。否则,把执行内核控制路径的进程加入到这个信号量的链表并阻塞该进程。当另一个进程在那个信号量上执行up()方法时,允许信号量链表上的一个进程继续执行。
3.5.4、自旋锁
自旋锁没有进程链表,当一个进程发现锁被另一个进程锁着时,他就不停地“旋转”,执行一个紧凑的循环指令直到锁打开。
3.5.5、避免死锁
通过按规定的顺序请求信号量来避免死锁。
3.6、信号和进程间通信
异步通告
同步错误或异常
3.7、进程管理
3.8、内存管理
3.8.1、虚拟内存
虚拟内存作为一种逻辑层,处于应用程序的内存请求与硬件内存管理单元(MMU)之间。
当进程使用一个虚拟地址时,内核和MMU协同定位其在内存中的实际物理位置。
3.9、设备驱动程序