真正的 Tornado 异步非阻塞

简介:

其中 Tornado 的定义是 Web 框架和异步网络库,其中他具备有异步非阻塞能力,能解决他两个框架请求阻塞的问题,在需要并发能力时候就应该使用 Tornado

但是在实际使用过程中很容易把 Tornado 使用成异步阻塞框架,这样对比其他两大框架没有任何优势而言,本文就如何实现真正的异步非阻塞记录。

以下使用的 Python 版本为 2.7.13

平台为 Macbook Pro 201

使用 gen.coroutine 异步编程

在 Tornado 中两个装饰器:

tornado.web.asynchronous
tornado.gen.coroutine

asynchronous 装饰器是让请求变成长连接的方式,必须手动调用 self.finish() 才会响应

class MainHandler(tornado.web.RequestHandler):

    @tornado.web.asynchronous

    def get(self):

        # bad 

        self.write("Hello, world")

asynchronous 装饰器不会自动调用self.finish() ,如果没有没有指定结束,该长连接会一直保持直到 pending 状态。


所以正确是使用方式是使用了 asynchronous 需要手动 finish

class MainHandler(tornado.web.RequestHandler):

    @tornado.web.asynchronous

    def get(self):

        self.write("Hello, world")

        self.finish()

coroutine 装饰器是指定改请求为协程模式,说明白点就是能使用 yield 配合 Tornado 编写异步程序。

Tronado 为协程实现了一套自己的协议,不能使用 Python 普通的生成器。

在使用协程模式编程之前要知道如何编写 Tornado 中的异步函数,Tornado 提供了多种的异步编写形式:回调、Future、协程等,其中以协程模式最是简单和用的最多。

编写一个基于协程的异步函数同样需要 coroutine 装饰器

@gen.coroutine

def sleep(self):

    yield gen.sleep(10)

    raise gen.Return([1, 2, 3, 4, 5])

这就是一个异步函数,Tornado 的协程异步函数有两个特点:

需要使用 coroutine 装饰器
返回值需要使用 raise gen.Return() 当做异常抛出

返回值作为异常抛出是因为在 Python 3.2 之前生成器是不允许有返回值的。

使用过 Python 生成器应该知道,想要启动生成器的话必须手动执行 next() 方法才行,所以这里的 coroutine 装饰器的其中一个作用就是在调用这个异步函数时候自动执行生成器。

使用 coroutine 方式有个很明显是缺点就是严重依赖第三方库的实现,如果库本身不支持 Tornado 的异步操作再怎么使用协程也是白搭依然会是阻塞的,放个例子感受一下。

import time

import logging

import tornado.ioloop

import tornado.web

import tornado.options

from tornado import gen



tornado.options.parse_command_line()



class MainHandler(tornado.web.RequestHandler):

    @tornado.web.asynchronous

    def get(self):

        self.write("Hello, world")

        self.finish()





class NoBlockingHnadler(tornado.web.RequestHandler):

    @gen.coroutine

    def get(self):

        yield gen.sleep(10)

        self.write('Blocking Request')





class BlockingHnadler(tornado.web.RequestHandler):

    def get(self):

        time.sleep(10)

        self.write('Blocking Request')



def make_app():

    return tornado.web.Application([

        (r"/", MainHandler),

        (r"/block", BlockingHnadler),

        (r"/noblock", NoBlockingHnadler),

    ], autoreload=True)



if __name__ == "__main__":

    app = make_app()

    app.listen(8000)

    tornado.ioloop.IOLoop.current().start()

为了显示更明显设置了 10 秒

当我们使用 yield gen.sleep(10) 这个异步的 sleep 时候其他请求是不阻塞的。


当使用 time.sleep(10) 时候会阻塞其他的请求。


这里的异步非阻塞是针对另一请求来说的,本次的请求该是阻塞的仍然是阻塞的。

gen.coroutine 在 Tornado 3.1 后会自动调用 self.finish() 结束请求,可以不使用 asynchronous装饰器。

所以这种实现异步非阻塞的方式需要依赖大量的基于 Tornado 协议的异步库,使用上比较局限,好在还是有一些可以用的异步库

基于线程的异步编程

使用 gen.coroutine 装饰器编写异步函数,如果库本身不支持异步,那么响应任然是阻塞的。

在 Tornado 中有个装饰器能使用 ThreadPoolExecutor 来让阻塞过程编程非阻塞,其原理是在 Tornado 本身这个线程之外另外启动一个线程来执行阻塞的程序,从而让 Tornado 变得阻塞。

futures 在 Python3 是标准库,但是在 Python2 中需要手动安装

pip install futures

import time

import logging

import tornado.ioloop

import tornado.web

import tornado.options

from tornado import gen

from tornado.concurrent import run_on_executor

from concurrent.futures import ThreadPoolExecutor



tornado.options.parse_command_line()



class MainHandler(tornado.web.RequestHandler):

    @tornado.web.asynchronous

    def get(self):

        self.write("Hello, world")

        self.finish()





class NoBlockingHnadler(tornado.web.RequestHandler):

    executor = ThreadPoolExecutor(4)



    @run_on_executor

    def sleep(self, second):

        time.sleep(second)

        return second



    @gen.coroutine

    def get(self):

        second = yield self.sleep(5)

        self.write('noBlocking Request: {}'.format(second))



def make_app():

    return tornado.web.Application([

        (r"/", MainHandler),

        (r"/noblock", NoBlockingHnadler),

    ], autoreload=True)



if __name__ == "__main__":

    app = make_app()

    app.listen(8000)

    tornado.ioloop.IOLoop.current().start()

ThreadPoolExecutor 是对标准库中的 threading 的高度封装,利用线程的方式让阻塞函数异步化,解决了很多库是不支持异步的问题。


但是与之而来的问题是,如果大量使用线程化的异步函数做一些高负载的活动,会导致该 Tornado 进程性能低下响应缓慢,这只是从一个问题到了另一个问题而已。

所以在处理一些小负载的工作,是能起到很好的效果,让 Tornado 异步非阻塞的跑起来。

但是明明知道这个函数中做的是高负载的工作,那么你应该采用另一种方式,使用 Tornado 结合 Celery 来实现异步非阻塞。

基于 Celery 的异步编程

Celery 是一个简单、灵活且可靠的,处理大量消息的分布式系统,专注于实时处理的任务队列,同时也支持任务调度。

Celery 并不是唯一选择,你可选择其他的任务队列来实现,但是 Celery 是 Python 所编写,能很快的上手,同时 Celery 提供了优雅的接口,易于与 Python Web 框架集成等特点。

与 Tornado 的配合可以使用 tornado-celery ,该包已经把 Celery 封装到 Tornado 中,可以直接使用。

实际测试中,由于 tornado-celery 很久没有更新,导致请求会一直阻塞,不会返回

解决办法是:

  1. 把 celery 降级到 3.1 pip install celery==3.1

  2. 把 pika 降级到 0.9.14 pip install pika==0.9.14

import time

import logging

import tornado.ioloop

import tornado.web

import tornado.options

from tornado import gen



import tcelery, tasks



tornado.options.parse_command_line()

tcelery.setup_nonblocking_producer()





class MainHandler(tornado.web.RequestHandler):

    @tornado.web.asynchronous

    def get(self):

        self.write("Hello, world")

        self.finish()





class CeleryHandler(tornado.web.RequestHandler):

    @gen.coroutine

    def get(self):

        response = yield gen.Task(tasks.sleep.apply_async, args=[5])

        self.write('CeleryBlocking Request: {}'.format(response.result))





def make_app(): 

    return tornado.web.Application([

        (r"/", MainHandler),

        (r"/celery-block", CeleryHandler),

    ], autoreload=True)



if __name__ == "__main__":

    app = make_app()

    app.listen(8000)

    tornado.ioloop.IOLoop.current().start()

import os

import time

from celery import Celery

from tornado import gen



celery = Celery("tasks", broker="amqp://")

celery.conf.CELERY_RESULT_BACKEND = os.environ.get('CELERY_RESULT_BACKEND', 'amqp')



@celery.task

def sleep(seconds):

    time.sleep(float(seconds))

    return seconds



if __name__ == "__main__":

    celery.start()

Celery 的 Worker 运行在另一个进程中,独立于 Tornado 进程,不会影响 Tornado 运行效率,在处理复杂任务时候比进程模式更有效率。

总结

方法 优点 缺点 可用性
gen.coroutine 简单、优雅 需要异步库支持
线程 简单 可能会影响性能
Celery 性能好 操作复杂、版本低

目前没有找到最佳的异步非阻塞的编程模式,可用的异步库比较局限,只有经常用的,个人编写异步库比较困难。

推荐使用线程和 Celery 的模式进行异步编程,轻量级的放在线程中执行,复杂的放在 Celery 中执行。当然如果有异步库使用那最好不过了。

Python 3 中可以把 Tornado 设置为 asyncio 的模式,这样就使用 兼容 asyncio 模式的库,这应该是日后的方向。


原文发布时间为:2017-03-06 

本文作者:正小歪

本文来自云栖社区合作伙伴“Python中文社区”,了解相关信息可以关注“Python中文社区”微信公众号

相关文章
|
JavaScript API
required string parameter ‘XXX‘is not present 的几种情况
required string parameter ‘XXX‘is not present 的几种情况
3336 0
|
关系型数据库 MySQL 数据库
Docker部署Mysql数据库详解
Docker是一种流行的容器化平台,可以简化应用程序的部署和管理。在本博客中,我们将探讨如何使用Docker部署两个广泛使用的数据库:MySQL。我们将提供详细的步骤和相应的命令,以帮助您轻松地在Docker容器中设置和运行这个数据库。
2937 0
|
29天前
|
数据采集 弹性计算 人工智能
阿里云服务99元一年:2核2G、3M固定带宽、40G系统盘,续费也是99元一年,太炸裂!
阿里云推年度“真香机”:ECS经济型e实例(2核2G+3M固定带宽+40G ESSD系统盘),仅99元/年,新老用户同享,续费不涨价!活动延至2027年3月31日,适合建站、开发、轻量AI部署。
297 3
|
iOS开发
iOS - QRCode 二维码
1、QRCode 在 iOS7 以前,在 iOS 中实现二维码和条形码扫描,我们所知的有,两大开源组件 ZBar 与 ZXing。iOS7 之后可以利用系统原生 API 生成二维码, iOS8 之后可以生成条形码, 系统默认生成的颜色是黑色。
3261 0
|
1月前
|
存储 弹性计算 固态存储
阿里云2026年香港服务器价格更新:轻量 / ECS / 高配全机型报价
2026年阿里云香港服务器价格更新:轻量应用服务器低至25元/月(2核0.5G+200M峰值带宽),ECS按配置计费,2核4G起约199元/年;支持BGP多线、免备案,含不限流量与秒杀38元/年爆款机型。(239字)
1312 3
|
3月前
|
NoSQL 关系型数据库 分布式数据库
2026年阿里云数据库产品活动解析:云数据库 RDS、云原生数据库 PolarDB等数据库特惠
阿里云数据库活动为新用户提供全方位优惠,覆盖关系型、NoSQL及数据仓库产品。RDS新用户享指定规格3折/年或全系6折/年,如MySQL基础版100GB存储首年2232元起;PolarDB新用户全系规格6折/年,分布式版低至2.8折;Redis开源版2GB倚天版399元/年起,MongoDB指定规格1999元/年起;AnalyticDB MySQL版首月6折。活动涵盖从基础到企业级需求,助力企业以高性价比构建数据平台,降低上云门槛。
|
安全 虚拟化
RayLink 的软件
【10月更文挑战第17天】RayLink 的软件界面非常清爽,常见的远程控制功能它都提供,比如拖放文件传输、剪贴板互通等等,在使用上非常方便,无论是远程办公还是临时使用手机操作电脑,都能高效完成各种任务。
526 1
|
机器学习/深度学习 边缘计算 人工智能
迎接混合云下半场:Hybrid WAN赋能智能化的未来之路
Gartner预测,至2027年90%的企业将采用混合云策略,标志混合云在企业IT战略中的核心地位。文章探讨了混合云与边缘计算、AI及机器学习的结合对信息技术领域的影响,以及企业在混合云部署中面临的灵活性与安全性、低延迟与高效连接、成本控制等挑战。通过介绍Hybrid WAN解决方案及其在智能汽车和制造业的应用案例,展示了如何通过智能化网络管理、高性能连接和灵活的成本控制来克服这些挑战,实现混合云的高效部署。
 迎接混合云下半场:Hybrid WAN赋能智能化的未来之路
|
机器学习/深度学习 数据采集 人工智能
R语言是一种强大的编程语言,广泛应用于统计分析、数据可视化、机器学习等领域
R语言是一种广泛应用于统计分析、数据可视化及机器学习的强大编程语言。本文为初学者提供了一份使用R语言进行机器学习的入门指南,涵盖R语言简介、安装配置、基本操作、常用机器学习库介绍及实例演示,帮助读者快速掌握R语言在机器学习领域的应用。
1062 3
|
SQL 存储 关系型数据库
pg_rewind实现原理简单分析
pg_rewind的功能是在主备切换后回退旧主库上多余的事务变更,以便可以作为新主的备机和新主建立复制关系。本文简单介绍其实现原理。
2433 145

热门文章

最新文章

下一篇
开通oss服务