一个高性能的web服务是如何搭建的?

简介: 一个高性能的web服务是如何搭建的?

阅读文本大概需要 8 分钟。

640.jpg

用过 Flask 框架的朋友都知道,Flask 自带的 wsgi 性能低下,不支持高并发。

只适合你开发调试的时候用,所以在线上一般都使用 Nginx + gunicorn 才能获得更强的性能和更高的安全性!

gunicorn 是一个 python Wsgi http server,只支持在 Unix 系统上运行,下面我们来熟悉一下以 gunicorn 的配置与使用。

一、gunicorn 的安装

注意 gunicorn 不能在 windows 环境下使用

pip install gunicorn

比如有以下一个 app 的 py 文件

1from flask import Flask  
 2
 3app = Flask(__name__)  
 4
 5
 6@app.route('/')  
 7def index():  
 8    return 'hello world!' 
 9
10if __name__ == '__main__':  
11    app.run()

那么我们在 flask 的项目的目录下如何使用 gunicorn 来启动呢?

命令如下:

1gunicorn -w 4 -b 0.0.0.0:8000 app:app

其中:

第一个 app 指的是 app.py 文件;

第二个指的是第三行代码 flask 应用的名字。

二、gunicorn 的参数详解

通过 gunicorn -h 我们可以看到 gunicorn 有非常多的配置项,我将他们的参数配置项都列出来了,供大家参考:

1-c CONFIG : CONFIG,配置文件的路径,通过配置文件启动;生产环境使用;
 2
 3-b ADDRESS : ADDRESS,ip加端口,绑定运行的主机;
 4
 5-w INT,  --workers INT:用于处理工作进程的数量,为正整数,默认为1;
 6
 7-k STRTING, --worker-class STRTING:要使用的工作模式,默认为sync异步,可以下载eventlet和gevent并指定
 8--threads INT:处理请求的工作线程数,使用指定数量的线程运行每个worker。为正整数,默认为1。
 9
10--worker-connections INT:最大客户端并发数量,默认情况下这个值为1000。
11
12--backlog int:未决连接的最大数量,即等待服务的客户的数量。默认2048个,一般不修改;
13
14-p FILE, --pid FILE:设置pid文件的文件名,如果不设置将不会创建pid文件
15
16--access-logfile FILE : 要写入的访问日志目录
17
18--access-logformat STRING:要写入的访问日志格式
19
20--error-logfile FILE, --log-file FILE :  要写入错误日志的文件目录。
21
22--log-level LEVEL :  错误日志输出等级。
23
24--limit-request-line INT : HTTP请求头的行数的最大大小,此参数用于限制HTTP请求行的允许大小,默认情况下,这个值为4094。值是0~8190的数字。
25
26--limit-request-fields INT : 限制HTTP请求中请求头字段的数量。此字段用于限制请求头字段的数量以防止DDOS攻击,默认情况下,这个值为100,这个值不能超过32768
27
28--limit-request-field-size INT : 限制HTTP请求中请求头的大小,默认情况下这个值为8190字节。值是一个整数或者0,当该值为0时,表示将对请求头大小不做限制
29
30-t INT, --timeout INT:超过这么多秒后工作将被杀掉,并重新启动。一般设定为30秒;
31
32--daemon:是否以守护进程启动,默认false;
33
34--chdir :在加载应用程序之前切换目录;
35
36--graceful-timeout INT:默认情况下,这个值为30,在超时(从接收到重启信号开始)之后仍然活着的工作将被强行杀死;一般使用默认;
37
38--keep-alive INT:在keep-alive连接上等待请求的秒数,默认情况下值为2。一般设定在1~5秒之间。
39
40--reload:默认为False。此设置用于开发,每当应用程序发生更改时,都会导致工作重新启动。
41
42--spew:打印服务器执行过的每一条语句,默认False。此选择为原子性的,即要么全部打印,要么全部不打印;
43
44--check-config :显示现在的配置,默认值为False,即显示。
45
46-e ENV,  --env ENV: 设置环境变量;
47

是不是觉得 gunicorn 的参数很多?在部署的时候如果输入这么大一串命令,我相信就算是对参数很熟悉的人,也有可能会输错!

那么,有没有更方便的方法呢?当然!那就是用以配置文件的方式启动。

三、以配置文件的方式启动

一般这个配置文件名是 gunicorn.conf.py 或者 config.py。其中部分代码如下:

1# 并行工作进程数
 2workers = 4
 3
 4# 指定每个工作者的线程数
 5threads = 2
 6
 7# 端口 5000
 8bind = '0.0.0.0:5000'
 9
10# 设置守护进程,将进程交给supervisor管理
11daemon = 'false'
12
13# 工作模式协程
14worker_class = 'gevent'
15
16# 设置最大并发量
17worker_connections = 2000
18
19# 设置进程文件目录
20pidfile = '/var/run/gunicorn.pid'
21
22# 设置访问日志和错误信息日志路径
23accesslog = "log/access.log"
24errorlog = "log/debug.log"
25loglevel = "debug"
26
27# 设置日志记录水平
28loglevel = 'warning'

代码里面的注释都很详细了,但是还是有几点需要说明的:

1.日志

配置文件中指定了日志文件的输出目录,需要注意的是:

  • 需要log目录存在,如果不存在,启动会报错
  • accesslog 是访问日志,可以通过 access_log_format 设置访问日志格式
  • loglevel 用于控制 errorlog 的信息级别

不过更建议使用 logging 模块来管理日志

2. workers

  • worker_class 是指开启的每个工作进程的模式类型,默认为 sync 模式,这个使用 gevent 模式,gevent 是 python 的一个高并发库
  • workers 是并行工作进程数 ,在上述配置文件中,取的是服务器的 CPU的数量。
  • 需要注意的是,这个数字不是越大越好,因为我们还要注意部署机器的性能,不能无限制多开。一般是根据服务器的 CPU核心数来确定的!
  • workers = multiprocessing * cpu_count() * 2 + 1

配置文件搞定之后,启动命令就很简单了。启动 gunicorn 命令如下:

1gunicorn -c gunicorn.conf app:app


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
3天前
|
开发框架 监控 .NET
Visual Basic的Web服务和REST API开发指南
【4月更文挑战第27天】本文探讨了使用Visual Basic(VB.NET)构建Web服务和RESTful API的方法。首先介绍了Web服务的基础和REST API的概念,然后阐述了.NET Framework与.NET Core/.NET 5+对VB.NET的支持,以及ASP.NET Core在Web开发中的作用。接着,详细讲解了创建RESTful API的步骤,包括控制器与路由设置、模型绑定与验证,以及返回响应。此外,还讨论了安全措施、测试方法、部署选项和监控策略。最后强调,VB.NET开发者可以通过ASP.NET Core涉足现代Web服务开发,拓宽技术领域。
|
2月前
|
网络协议 Java Nacos
nacos常见问题之在web界面 上下线服务时报错 400如何解决
Nacos是阿里云开源的服务发现和配置管理平台,用于构建动态微服务应用架构;本汇总针对Nacos在实际应用中用户常遇到的问题进行了归纳和解答,旨在帮助开发者和运维人员高效解决使用Nacos时的各类疑难杂症。
33 0
|
2月前
|
监控 Serverless 测试技术
Serverless 应用引擎常见问题之做的web服务计费如何解决
Serverless 应用引擎(Serverless Application Engine, SAE)是一种完全托管的应用平台,它允许开发者无需管理服务器即可构建和部署应用。以下是Serverless 应用引擎使用过程中的一些常见问题及其答案的汇总:
408 3
|
5天前
|
前端开发 JavaScript Go
构建高性能Web应用:优化前端资源加载
在构建现代Web应用时,优化前端资源加载是至关重要的一步。本文将介绍一些提升Web应用性能的关键策略,包括减少HTTP请求、压缩和合并资源、使用CDN加速、以及异步加载技术等。通过实施这些优化策略,开发人员可以显著提升网站的加载速度和用户体验。
|
5天前
|
存储 中间件 Go
探索Gin框架:快速构建高性能的Golang Web应用
探索Gin框架:快速构建高性能的Golang Web应用
|
12天前
|
JSON API 数据库
解释如何在 Python 中实现 Web 服务(RESTful API)。
在Python中实现Web服务(RESTful API)涉及选择框架(如Flask、Django、FastAPI),定义路由及处理函数(对应HTTP请求方法),处理请求,构建响应和启动服务器。以下是一个使用Flask的简单示例:定义用户列表,通过`@app.route`装饰器设置GET和POST请求处理函数,返回JSON响应,并用`app.run()`启动服务器。实际API会包含更复杂的逻辑和错误处理。
14 1
|
14天前
|
缓存 监控 数据库
Flask性能优化:打造高性能Web应用
【4月更文挑战第16天】本文介绍了提升Flask应用性能的七大策略:优化代码逻辑,减少数据库查询,使用WSGI服务器(如Gunicorn、uWSGI),启用缓存(如Flask-Caching),优化数据库操作,采用异步处理与并发(如Celery、Sanic),以及持续监控与调优。通过这些手段,开发者能有效优化Flask应用,适应大型或高并发场景,打造高性能的Web服务。
|
28天前
|
数据采集 Java API
python并发编程: Python使用线程池在Web服务中实现加速
python并发编程: Python使用线程池在Web服务中实现加速
18 3
python并发编程: Python使用线程池在Web服务中实现加速
|
2月前
javaWeb服务详解(含源代码,测试通过,注释) ——web.xml
javaWeb服务详解(含源代码,测试通过,注释) ——web.xml
7 0
|
2月前
|
XML JSON API
通过Flask框架创建灵活的、可扩展的Web Restful API服务
通过Flask框架创建灵活的、可扩展的Web Restful API服务