进程(Process)是程序运行的一个实例,是定义在多用户、多任务操作系统环境下用于表示应用程序在内存环境中基本执行单元。系统分配资源的基本单位。
CPU 数量有限,而系统上要运行的任务(进程)很多,在任意时刻CPU只能运行一个进程。采用分时机制,把CPU的运算时间进行分片,让每个进程都获得CPU的时间片(time slice).由于进程运行的时间片很短,所以从表面看来所有进程是在同时运行着。意思是说,进程A使用完它的CPU时间后,内核根据调度算法把进程B调度到CPU上来运行,等到进程B使用完它的CPU时间后,内核根据调度策略又把另外一个进程调度到CPU上运行,就此类推。而该过程就叫做:进程的上下文切换(context switches)
Linux 内核用数据结构 task_struct(任务数据结构) 表示一个进程,taks_struct 是在创建进程时候,内核为了追踪一个进程而使用的数据结构。
操作系统使用 task_struct 保持跟踪进程运行所需的所有状态信息。这种状态,也就是”上下文“。它包括许多信息,例如 PC(指令计数器) 和寄存器文件的当前值,以及主存的内容。在任何一个时刻,单处理器系统都只能执行一个进程的代码。当操作系统决定要把控制权从当前进程转移到某一个新进程时,就会进行“上下文切换”,即保存当前进程的上下文、恢复用户进程的上下文,然后将控制权传递到新进程。新进程就会从上次停止的地方开始执行。
监测指定的进程的运行状况:页请求错误、虚拟内存的大小、常驻内存的大小等:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
[root@node2 ~]
# watch -n 1 'ps axo pid,comm,min_flt,maj_flt,trs,drs,vsize,size,rss | grep httpd'
Every 1.0s:
ps
axo pid,
comm
,min_flt,maj_flt,trs,drs,vsize,size,rss |
grep
httpd Sat Jun 14 03:14:09 2014
3521 httpd 1169 2 387 35384 35772 13288 10248
3524 httpd 3194 55 387 37672 38060 15576 12300
3525 httpd 2179 6 387 37136 37524 15040 11524
3527 httpd 356 2 387 35384 35772 13288 9160
3528 httpd 1618 5 387 37908 38296 15812 12036
4539 httpd 1540 5 387 37656 38044 15560 11816
4549 httpd 4552 87 387 36860 37248 14764 11376
4550 httpd 2311 10 387 38928 39316 16832 13352
4551 httpd 3790 12 387 37656 38044 15560 12220
4552 httpd 363 3 387 35384 35772 13288 9184
4629 httpd 355 1 387 35384 35772 13288 9156
|
说明:
min_flt(minor fault) 表示程序的页请求错误次数.内存中已经缓存有进程所需要的页面数据
了。只要把该页面数据与进程的虚拟地址空间建立映射关系就可以了。
maj_flt(major fault) 表示程序的页请求错误次数。内存中没有缓存有进程所需要的页面数
据。内核必需要通知CPU从磁盘中把页面数据加载到内存中来。
TRS 表示程序所拥有的可执行虚拟内存的大小(KB);
DRS 表示程序数据段和用户态的栈的大小(KB);
vsize 表示程序使用的虚拟内存大小(KB) total vm size in KB.
size 表示程序使用的内存大小(KB) memory size in kilobytes.
rss 表示程序常驻内存的大小。常驻内存指的是,该进程占据的页面是不可
以从物理内存交换出去的。
TRS + DRS = vsize
通过 /proc接口 查看进程(应用程序)所能使用的系统资源:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
[root@node2 ~]
# cat /proc/3521/limits
Limit Soft Limit Hard Limit Units
Max cpu
time
unlimited unlimited seconds
Max
file
size unlimited unlimited bytes
Max data size unlimited unlimited bytes
Max stack size 10485760 unlimited bytes
Max core
file
size 0 unlimited bytes
Max resident
set
unlimited unlimited bytes
Max processes 4096 4096 processes
Max
open
files 1024 1024 files
Max locked memory 32768 32768 bytes
Max address space unlimited unlimited bytes
Max
file
locks unlimited unlimited locks
Max pending signals 4096 4096 signals
Max msgqueue size 819200 819200 bytes
Max
nice
priority 0 0
Max realtime priority 0 0
|
说明:
Max cpu time 能使用的CPU时间
Max stack size 能使用的最大栈(stack)大小(bytes)
Max processes 父进程最多同时能 fork 多少个进程。
Max open files 最多同时可以打开多少个文件。像 Nginx 服务器,使用 一个进程响应N个请
求,那么只能并发1024个用户请求。
一个套接字文件表示一个用户请求。所以,想要 Nginx 并发更大的请求数,首先要修改它能同时打开的文件数量。
动态监控系统中占用物理内存最大的任务(进程)。方法:使用命令【top】,再与top进程交互,按"M"键,命令【top】显示的结果就按照占用物理内存大小进行
排序。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
|
[root@node2 ~]
# top
top
- 04:08:05 up 2:06, 3
users
, load average: 0.02, 0.03, 0.00
Tasks: 106 total, 1 running, 105 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.3%us, 3.0%sy, 0.0%ni, 96.0%
id
, 0.3%wa, 0.0%hi, 0.3%si, 0.0%st
Mem: 255412k total, 233208k used, 22204k
free
, 31548k buffers
Swap: 128512k total, 0k used, 128512k
free
, 87048k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3141 mysql 15 0 304m 35m 5280 S 0.0 14.3 0:00.77 mysqld
4550 daemon 15 0 39316 13m 2856 S 0.0 5.2 0:00.13 httpd
3524 daemon 15 0 38060 12m 2884 S 0.0 4.8 0:00.29 httpd
4551 daemon 15 0 38044 11m 2856 S 0.0 4.8 0:00.27 httpd
3528 daemon 15 0 38296 11m 2860 S 0.0 4.7 0:00.09 httpd
4539 daemon 15 0 38044 11m 2852 S 0.0 4.6 0:00.07 httpd
3525 daemon 15 0 37524 11m 2856 S 0.0 4.5 0:00.16 httpd
4549 daemon 15 0 37248 11m 2880 S 0.0 4.5 0:00.36 httpd
3394 root 34 19 25448 10m 2104 S 0.0 4.0 0:00.03 yum-updatesd
3521 root 18 0 35772 10m 3496 S 0.0 4.0 0:00.10 httpd
4552 daemon 15 0 35772 9184 2384 S 0.0 3.6 0:00.05 httpd
3527 daemon 15 0 35772 9160 2364 S 0.0 3.6 0:00.01 httpd
4629 daemon 15 0 35772 9156 2364 S 0.0 3.6 0:00.00 httpd
[root@node2 ~]
# top 使用"A"键与【top】交互
1:Def - 04:38:57 up 2:37, 3
users
, load average: 0.11, 0.08, 0.02
Tasks: 107 total, 4 running, 102 sleeping, 0 stopped, 1 zombie
Cpu(s): 0.7%us, 2.0%sy, 0.0%ni, 97.0%
id
, 0.0%wa, 0.0%hi, 0.3%si, 0.0%st
Mem: 255412k total, 236148k used, 19264k
free
, 34488k buffers
Swap: 128512k total, 0k used, 128512k
free
, 87056k cached
1 PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3141 mysql 15 0 304m 35m 5280 S 0.0 14.3 0:00.87 mysqld
4550 daemon 15 0 39316 13m 2856 S 0.0 5.2 0:00.13 httpd
3524 daemon 15 0 38060 12m 2884 S 0.0 4.8 0:00.29 httpd
4551 daemon 15 0 38044 11m 2856 S 0.0 4.8 0:00.27 httpd
3528 daemon 15 0 38296 11m 2860 S 0.0 4.7 0:00.09 httpd
2 PID PPID TIME+ %CPU %MEM PR NI S VIRT SWAP RES UID COMMAND
19730 7719 0:00.00 0.0 0.0 19 0 Z 0 0 0 0 sh <defunct>
19121 3654 0:01.11 0.0 0.4 15 0 R 2320 1296 1024 0
top
13403 13401 0:00.16 0.0 0.3 15 0 S 4184 3384 800 0
less
13401 13399 0:00.00 0.0 0.4 20 0 S 4488 3504 984 0 sh
13399 3482 0:00.00 0.0 0.3 18 0 S 3900 3128 772 0
man
3 PID %MEM VIRT SWAP RES CODE DATA SHR nFLT nDRT S PR NI %CPU COMMAND
3141 14.3 304m 268m 35m 8688 293m 5280 86 0 S 15 0 0.0 mysqld
4550 5.2 39316 25m 13m 388 16m 2856 10 0 S 15 0 0.0 httpd
3524 4.8 38060 25m 12m 388 15m 2884 55 0 S 15 0 0.0 httpd
4551 4.8 38044 25m 11m 388 15m 2856 12 0 S 15 0 0.0 httpd
3528 4.7 38296 25m 11m 388 15m 2860 5 0 S 15 0 0.0 httpd
4539 4.6 38044 25m 11m 388 15m 2852 5 0 S 15 0 0.0 httpd
|
说明:
说明:
VIRT 进程使用的虚拟内存的大小。包括代码段(code)、数据段(data)和共享库以及交换到
swap的页面。(KB)
VIRT = SWAP + RES
SWAP 虚拟内存影像的一部分 The swapped out portion of a task's total virtual memory image.
(KB)
RES 进程使用的物理内存的大小,指的是常驻内存的大小。(KB) The non-swapped physical
memory a task has used.
RES = CODE + DATA
CODE Code size (KB) 进程所常驻物理内存大小中用于执行代码的内存的大小,Text segment.
DATA Data+Stack size (KB) 数据段Data segment + 栈段 stack segment
SHR 一个进程使用的共享内存大小 Shared Mem size (KB)
nFLT major fault类型的页请求错误数 Page Fault count. The number of major page faults
that have occurred for a task.
nDRT 进程写到磁盘的脏页数 Dirty Pages count
总结:
如果 Appache 服务器是基于 prefork 模型的话,一个进程就要占据大约 12M 的物理内存空间。还不包括被从物理内存中交换出去的页面。
基于 prefork 模型的 Appache 服务器,是使用一个进程响应一个用户的请求的。假如并发请求数
为1000,那么我们的 httpd 服务器最少要消耗12M * 1000 = 12000M 也就是大约10GB的内存。
使用命令 pmap 查看进程的地址空间分布(也可以使用 cat /proc/<pid>/maps):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
[root@node2 ~]
# pmap 3910
3910: nginx: master process
/usr/sbin/nginx
-c
/etc/nginx/nginx
.conf
002ca000 104K r-x--
/lib/ld-2
.5.so
002e4000 4K r-x--
/lib/ld-2
.5.so
002e5000 4K rwx--
/lib/ld-2
.5.so
002ed000 1276K r-x--
/lib/libc-2
.5.so
0042c000 4K --x--
/lib/libc-2
.5.so
0042d000 8K r-x--
/lib/libc-2
.5.so
0042f000 4K rwx--
/lib/libc-2
.5.so
00430000 12K rwx-- [ anon ]
......
08047000 432K r-x--
/usr/sbin/nginx
080b3000 40K rw---
/usr/sbin/nginx
080bd000 40K rw--- [ anon ]
097fe000 132K rw--- [ anon ]
b7fe6000 20K rw--- [ anon ]
b7ff4000 4K rw-s-
/dev/zero
(deleted)
bff8f000 84K rw--- [ stack ]
total 5740K
|
说明:
第一列为内存区域起始地址,第二列为内存区域大小(虚拟内存),第三列为属性,第四列为内存映
射的文件。
一个进程运行的时候,其用到文件的代码段、数据段等都是映射到内存地址区域的。这个功能是
通过系统调用 mmap() 来完成的。
进程占用的虚拟内存为:5740KB.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
[root@node2 ~]
# pmap -x 3910
3910: nginx: master process
/usr/sbin/nginx
-c
/etc/nginx/nginx
.conf
Address Kbytes RSS Dirty Mode Mapping
002ca000 104 0 0 r-x-- ld-2.5.so
002e4000 4 4 4 r-x-- ld-2.5.so
002e5000 4 4 4 rwx-- ld-2.5.so
002ed000 1276 48 0 r-x-- libc-2.5.so
0042c000 4 0 0 --x-- libc-2.5.so
0042d000 8 8 4 r-x-- libc-2.5.so
0042f000 4 4 4 rwx-- libc-2.5.so
00430000 12 12 12 rwx-- [ anon ]
......
08047000 432 68 0 r-x-- nginx
080b3000 40 40 36 rw--- nginx
080bd000 40 12 12 rw--- [ anon ]
097fe000 132 124 124 rw--- [ anon ]
b7fe6000 20 20 20 rw--- [ anon ]
b7ff4000 4 0 0 rw-s- zero (deleted)
bff8f000 84 12 12 rw--- [ stack ]
-------- ------- ------- ------- -------
total kB 5740 - - -
|
说明:
该进程所占据的虚拟地址空间为: 5740KB;
RSS 表示该进程的常驻内存的大小(KB);
Dirty 表示脏页。
可以看得出,它们的地址是连续的。
使用接口 /proc
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
[root@node2 ~]
# cat /proc/3910/maps
002ca000-002e4000 r-xp 00000000 08:02 67212
/lib/ld-2
.5.so
002e4000-002e5000 r-xp 00019000 08:02 67212
/lib/ld-2
.5.so
002e5000-002e6000 rwxp 0001a000 08:02 67212
/lib/ld-2
.5.so
002ed000-0042c000 r-xp 00000000 08:02 67213
/lib/libc-2
.5.so
0042c000-0042d000 --xp 0013f000 08:02 67213
/lib/libc-2
.5.so
0042d000-0042f000 r-xp 0013f000 08:02 67213
/lib/libc-2
.5.so
0042f000-00430000 rwxp 00141000 08:02 67213
/lib/libc-2
.5.so
00430000-00433000 rwxp 00430000 00:00 0
......
08047000-080b3000 r-xp 00000000 08:02 1525801
/usr/sbin/nginx
080b3000-080bd000 rw-p 0006b000 08:02 1525801
/usr/sbin/nginx
080bd000-080c7000 rw-p 080bd000 00:00 0
097fe000-0981f000 rw-p 097fe000 00:00 0 [heap]
b7fe6000-b7feb000 rw-p b7fe6000 00:00 0
b7ff4000-b7ff5000 rw-s 00000000 00:09 17042
/dev/zero
(deleted)
bff8f000-bffa4000 rw-p bffea000 00:00 0 [stack]
|
通过 /proc 接口查看进程的状态
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
[root@node2 ~]
# cat /proc/3521/status
。。。
VmPeak: 35772 kB
VmSize: 35772 kB
VmLck: 0 kB
VmHWM: 10248 kB
VmRSS: 10248 kB
VmData: 13204 kB
VmStk: 84 kB
VmExe: 388 kB
VmLib: 21016 kB
VmPTE: 68 kB
StaBrk: 085f7000 kB
Brk: 08846000 kB
StaStk: bfd6bc20 kB
。。。
Cpus_allowed: 00000001
Mems_allowed: 1
|
查看一个可执行二进制程序所依赖的库文件。
1
2
3
4
5
6
7
8
|
[root@node2 ~]
# ldd /usr/local/apache2/bin/httpd
linux-gate.so.1 => (0x00f40000)
libm.so.6 =>
/lib/libm
.so.6 (0x00455000)
libaprutil-1.so.0 =>
/usr/lib/libaprutil-1
.so.0 (0x007b4000)
libcrypt.so.1 =>
/lib/libcrypt
.so.1 (0x00c79000)
libldap-2.3.so.0 =>
/usr/lib/libldap-2
.3.so.0 (0x001f2000)
liblber-2.3.so.0 =>
/usr/lib/liblber-2
.3.so.0 (0x0025a000)
......
|
追踪一个已经启动的进程
1
|
[root@node2 ~]
# strace -p 3521
|
追踪启动一个进程启动的时间、发生的系统调用、是否有错误等等
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
[root@node2 ~]
# strace -c /usr/local/apache2/bin/httpd
%
time
seconds usecs
/call
calls errors syscall
------ ----------- ----------- --------- --------- ----------------
59.55 0.002931 183 16 mprotect
12.21 0.000601 9 65 munmap
11.40 0.000561 561 1 clone
11.19 0.000551 3 178
read
1.36 0.000067 0 292 mmap2
1.20 0.000059 0 180 27
open
0.95 0.000047 0 151 fstat64
0.93 0.000046 0 114
time
0.45 0.000022 4 6 write
0.41 0.000020 0 164 close
0.00 0.000000 0 1 execve
0.00 0.000000 0 1 chdir
0.00 0.000000 0 1 lseek
0.00 0.000000 0 2 1 access
。。。
0.00 0.000000 0 12 socket
0.00 0.000000 0 3 bind
0.00 0.000000 0 8 6 connect
。。。
0.00 0.000000 0 1 semget
0.00 0.000000 0 2 semctl
------ ----------- ----------- --------- --------- ----------------
100.00 0.004922 1293 50 total
|
查看一个进程打开的文件
1
2
3
4
5
6
7
8
9
|
[root@node2 ~]
# lsof -p 3910
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
nginx 3910 root cwd DIR 8,2 4096 2 /
nginx 3910 root rtd DIR 8,2 4096 2 /
nginx 3910 root txt REG 8,2 3923026 1525801
/usr/sbin/nginx
nginx 3910 root mem REG 8,2 125736 67212
/lib/ld-2
.5.so
nginx 3910 root mem REG 8,2 1611564 67213
/lib/libc-2
.5.so
nginx 3910 root mem REG 8,2 16428 67217
/lib/libdl-2
.5.so
......
|
通过 /proc 接口查看进程打开的文件
1
2
3
4
5
6
7
8
9
10
|
[root@node2 ~]
# ll /proc/3910/fd/
total 0
lrwx------ 1 root root 64 Jun 14 10:09 0 ->
/dev/null
lrwx------ 1 root root 64 Jun 14 10:09 1 ->
/dev/null
l-wx------ 1 root root 64 Jun 14 10:09 2 ->
/var/log/nginx_error
.log
lrwx------ 1 root root 64 Jun 14 10:09 3 -> socket:[17044]
l-wx------ 1 root root 64 Jun 14 10:09 4 ->
/var/log/nginx_error
.log
l-wx------ 1 root root 64 Jun 14 10:09 5 ->
/var/log/nginx/access
.log
lrwx------ 1 root root 64 Jun 14 10:09 6 -> socket:[17041]
lrwx------ 1 root root 64 Jun 14 10:09 7 -> socket:[17045]
|
本文转自成长的小虫 51CTO博客,原文链接:http://blog.51cto.com/9528du/1425129,如需转载请自行联系原作者