关于Nginx:
Nginx主要的2个用途是静态页面web服务器和7层反向代理web服务器(常见的协议都可以做反向代理),而且它本身还具有很大的缓存功能,但是一般缓存文件元数据(描述符)或者文件数据,但是缓存能力有限,如果要发挥其缓存能力就需要用第三方扩展。
其实真正实现缓存功能是varnish、squid(轻量级的,很多用于CDN服务器)。Varnish是专业级的缓存工具,但任何缓存工具本身都是反向代理,所以它本身也是一个web的反向代理服务,不过它的反向代理功能就差很多。
在web反向代理领域尤其是负载均衡方面有一个强大的对手就是HAproxy,从名字上看是HA,但是它本身实现的并不是一种高可用服务,它提供的是基于应用层和TCP的反向代理,它可以应用在MySQL和HTTP等做负载均衡。
在中大型站点中可能会用到MogileFS,它用作图片存储,是一种分布式文件系统。
Apache功能也很多,但是它诞生到现在太久了,所以它是一个重量级的WEB服务器,它不支持高并发,但是它以稳定为主。在MPM中早先流行的是prefork,它的模式是一个进程响应一个用户请求,如果一个进程需要1M内存,那如果1万呢,要多少内存?太消耗资源,这也就是后来Apache引入了event机制。面对Apache的现状也就是出现了c10k的问题,就是1万连接。还有人专门讨论过,所以就出现了轻量级的WEB服务器,能够突破10K。
基本功能:
静态资源的WEB服务器,另外还可以自动缓存打开的文件描述符(如果文件被用户访问过它就会直接缓存在内存中)
反向代理服务器,缓存、负载均衡
支持Fastcgi协议,可以和PHP的FPM协议工作。
Nginx是模块化的,从1.9.1开始支持动态装载。支持ZIP过滤去,SSI和图像大小调整。不过Tengine可以使用DSO。
基于名称和IP做虚拟主机、支持长连接、支持平滑升级、URL地址重写、支持速率和并发限制等。
基本结构:
Nginx的结构和Apache类似,有一个Master进程和多个work进程(也可称作线程,原因看说明1)。至于有多少可以自己调整,一个work进程可以相应多个用户请求,所以不是一对一的。理论来说一个work进程就够了,但是到底要启动多少个work进程,这取决于你的CPU物理核心数。work进程数量小于物理核心数量。也就是尽量避免进程切换,同时也要给操作系统留一个物理核心。极具性能的做法是,留出1个物理核心给操作系统,这个可以指定。其余的都分配给Nginx的work进程。对于操作系统来说一个物理核心就是一个CPU。比如2个物理CPU,每个是6核心,同时启动超线程,那么在系统上看到的就是24核心,也就是24个CPU。
一般会这样做,就是明确指定操作系统使用一个物理核心,然后手动的把其他核心的都绑定到Nginx的work进程上去。这就是Nginx优化之一。这么做就是为了避免切换次数。
如果Nginx作为反向代理的话,还会启动其他进程,比如管理缓存的。
Nginx是基于事件驱动机制,包括kqueue、epoll,/dev/poll;另外它还支持消息通知也就非事件驱动的select、poll等,不过这些也不是真正意义的通知。
支持sendfile,sendfile可以提高效率
用户访问网页的基本过程(不包含缓存功能):
-
一个请求发到内核(通过socket套接字,到网卡,然后会被Linux的防火墙接收,如果请求的对象是自己,它会判断是不是本地进程的端口,如果是就直接提交到用户空间的相应进程,否则就丢弃)
-
内核交给用户空间的服务进程,服务进程发现用户请求的是一个页面文件,然后服务进程发起系统调用
-
内核通过磁盘IO获取响应内容
-
内核获取了数据之后交给服务进程
-
然后服务进程封装成响应报文,然后再送进内核
-
由内核向外响应