Python中异常重试解决方案

简介:

Python中异常重试解决方案


在做数据抓取的时候,经常遇到由于网络问题导致的程序保存,先前只是记录了错误内容,并对错误内容进行后期处理。

原先的流程:


 
 
  1. def crawl_page(url): 
  2.  
  3.  
  4.     pass 
  5.  
  6.  
  7.   
  8.  
  9.  
  10. def log_error(url): 
  11.  
  12.  
  13.     pass 
  14.  
  15.  
  16.   
  17.  
  18.  
  19. url = "" 
  20.  
  21.  
  22. try: 
  23.  
  24.  
  25.    crawl_page(url) 
  26.  
  27.  
  28. except
  29.  
  30.  
  31.     log_error(url) 

改进后的流程:


 
 
  1. attempts = 0 
  2.  
  3.  
  4. success = False 
  5.  
  6.  
  7. while attempts < 3 and not success: 
  8.  
  9.  
  10.     try: 
  11.  
  12.  
  13.         crawl_page(url) 
  14.  
  15.  
  16.         success = True 
  17.  
  18.  
  19.     except
  20.  
  21.  
  22.         attempts = 1 
  23.  
  24.  
  25.         if attempts == 3: 
  26.  
  27.  
  28.             break 

最近发现的新的解决方案:retrying

retrying 是一个 Python 的重试包,可以用来自动重试一些可能运行失败的程序段。retrying 提供一个装饰器函数 retry,被装饰的函数就会在运行失败的条件下重新执行,默认只要一直报错就会不断重试。


 
 
  1. import random 
  2.  
  3.  
  4. from retrying import retry 
  5.  
  6.  
  7.   
  8.  
  9.  
  10. @retry 
  11.  
  12.  
  13. def do_something_unreliable(): 
  14.  
  15.  
  16.     if random.randint(0, 10) > 1: 
  17.  
  18.  
  19.         raise IOError("Broken sauce, everything is hosed!!!111one"
  20.  
  21.  
  22.     else
  23.  
  24.  
  25.         return "Awesome sauce!" 
  26.  
  27.  
  28.   
  29.  
  30.  
  31. print do_something_unreliable() 

如果我们运行 haveatry 函数,那么直到 random.randint 返回 5,它才会执行结束,否则会一直重新执行。

retry 还可以接受一些参数,这个从源码中 Retrying 类的初始化函数可以看到可选的参数:

  • stopmaxattempt_number:用来设定最大的尝试次数,超过该次数就停止重试
  • stopmaxdelay:比如设置成 10000,那么从被装饰的函数开始执行的时间点开始,到函数成功运行结束或者失败报错中止的时间点,只要这段时间超过 10 秒,函数就不会再执行了
  • wait_fixed:设置在两次 retrying 之间的停留时间
  • waitrandommin 和 waitrandommax:用随机的方式产生两次 retrying 之间的停留时间
  • waitexponentialmultiplier 和 waitexponentialmax:以指数的形式产生两次 retrying 之间的停留时间,产生的值为 2^previousattemptnumber * waitexponentialmultiplier,previousattemptnumber 是前面已经 retry 的次数,如果产生的这个值超过了 waitexponentialmax 的大小,那么之后两个 retrying 之间的停留值都为 waitexponentialmax。这个设计迎合了 exponential backoff 算法,可以减轻阻塞的情况。

我们可以指定要在出现哪些异常的时候再去 retry,这个要用 retryonexception 传入一个函数对象:


 
 
  1. def retry_if_io_error(exception): 
  2.  
  3.  
  4.     return isinstance(exception, IOError) 
  5.  
  6.  
  7.   
  8.  
  9.  
  10. @retry(retry_on_exception=retry_if_io_error) 
  11.  
  12.  
  13. def read_a_file(): 
  14.  
  15.  
  16.     with open("file""r"as f: 
  17.  
  18.  
  19.         return f.read() 

在执行 readafile 函数的过程中,如果报出异常,那么这个异常会以形参 exception 传入 retryifio_error 函数中,如果 exception 是 IOError 那么就进行 retry,如果不是就停止运行并抛出异常。

我们还可以指定要在得到哪些结果的时候去 retry,这个要用 retryonresult 传入一个函数对象:


 
 
  1. def retry_if_result_none(result): 
  2.  
  3.  
  4.     return result is None 
  5.  
  6.  
  7.   
  8.  
  9.  
  10. @retry(retry_on_result=retry_if_result_none) 
  11.  
  12.  
  13. def get_result(): 
  14.  
  15.  
  16.     return None 

在执行 getresult 成功后,会将函数的返回值通过形参 result 的形式传入 retryifresultnone 函数中,如果返回值是 None 那么就进行 retry,否则就结束并返回函数值。


作者:佚名

来源:51CTO

相关文章
|
1月前
|
测试技术 开发者 Python
对于Python中的异常要如何处理,raise关键字你真的了解吗?一篇文章带你从头了解
`raise`关键字在Python中用于显式引发异常,允许开发者在检测到错误条件时中断程序流程,并通过异常处理机制(如try-except块)接管控制。`raise`后可跟异常类型、异常对象及错误信息,适用于验证输入、处理错误、自定义异常、重新引发异常及测试等场景。例如,`raise ValueError(&quot;Invalid input&quot;)`用于验证输入数据,若不符合预期则引发异常,确保数据准确并提供清晰错误信息。此外,通过自定义异常类,可以针对特定错误情况提供更具体的信息,增强代码的健壮性和可维护性。
|
1月前
|
Python
在Python中,`try...except`语句用于捕获和处理程序运行时的异常
在Python中,`try...except`语句用于捕获和处理程序运行时的异常
49 5
|
1月前
|
Python
在Python中,自定义函数可以抛出自定义异常
在Python中,自定义函数可以抛出自定义异常
47 5
|
1月前
|
存储 开发者 Python
自定义Python的异常
自定义Python的异常
18 5
|
1月前
|
数据可视化 搜索推荐 Shell
Python与Plotly:B站每周必看榜单的可视化解决方案
Python与Plotly:B站每周必看榜单的可视化解决方案
|
2月前
|
存储 索引 Python
|
28天前
|
数据采集 API 定位技术
Python技术进阶:动态代理IP的跨境电商解决方案
Python技术进阶:动态代理IP的跨境电商解决方案
|
2月前
|
Python
Python生成器、装饰器、异常
【10月更文挑战第15天】
|
2月前
|
机器学习/深度学习 算法 Python
深度解析机器学习中过拟合与欠拟合现象:理解模型偏差背后的原因及其解决方案,附带Python示例代码助你轻松掌握平衡技巧
【10月更文挑战第10天】机器学习模型旨在从数据中学习规律并预测新数据。训练过程中常遇过拟合和欠拟合问题。过拟合指模型在训练集上表现优异但泛化能力差,欠拟合则指模型未能充分学习数据规律,两者均影响模型效果。解决方法包括正则化、增加训练数据和特征选择等。示例代码展示了如何使用Python和Scikit-learn进行线性回归建模,并观察不同情况下的表现。
496 3
|
2月前
|
设计模式 安全 JavaScript
Python学习八:面向对象编程(下):异常、私有等
这篇文章详细介绍了Python面向对象编程中的私有属性、私有方法、异常处理及动态添加属性和方法等关键概念。
28 1