借用subprocess和gevent、multiprocessing解决saltstack超时不准的问题

简介:

 新版的saltstack真是个坑!  前段时间为了做测试,直接从openstack那边搞了几台服务器,接入运维平台开始部署客户端minion的环境,直接yum的saltstack,当时也没有注意,就直接跑lvs的增删改查测试。  当天没出啥问题,今天再测试的时候,感觉前端总是拿不到数据,扯了半天,发现saltstack的超时不好用了,一开始还不知掉问题,后来通过日志,定位到salt超时问题。    


    以前用16和17的时候,虽然也不准,但是最少还是会主动的切断链接,2014版本倒好,只有结束才给你返回。


对于2014这个版本,我只能是服气,从一开是就很是蛋疼的~    


     看了下saltstack的源码,在对于zeromq操作的地方,有对时间参数的用法,但是貌似出问题,把源码里面的时间又减小了点,效果还是不稳,找了下saltstack对于任务的多进程分发,但是multiprocessing对于时间处理,貌似没问题。 但还是强改了下,结果。。。。。哥哥我真心有点怕了。。。  既然saltstack 可通过multiprocessing来控制链接的中断停止,那我就改源代码了,我重新写个模块定义超时中断,方法微微有点粗暴 !


下面是我一开始的效果,去minion执行sleep的命令,结果无效果。。。我估计会是版本的问题。


原文:http://rfyiamcool.blog.51cto.com/1030776/1377429

wKiom1Mkktehir_vAANIuCfPe2w301.jpg



咱们先用一个常用的方式,可以用subprocess的老方法, signal 的方式搞定超时控制。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import  subprocess,os, time, signal
#
def timeout_cmd(cmd, timeout):
     timeout=timeout- 1
     command = cmd.split( " " )
     import  subprocess, datetime, os, time, signal
     start = datetime.datetime.now()
     process = subprocess.Popen(command, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
     while  process.poll()  is  None:
         time.sleep( 0.1 )
         now = datetime.datetime.now()
         if  (now - start).seconds> timeout:
             os.kill(process.pid, signal.SIGKILL)
             os.waitpid(- 1 , os.WNOHANG)
             return  None
     return  process.stdout.read()


wKioL1MklF3DkduSAAPkXtNPOaE567.jpg


在这里提一下,用saltstack  api的超时,默认控制在10s的,但我抓到一个微妙的特征,10左右,时间算是精确中断,但是时间一高,你的超时精确就有点不准了。


下面的方法是用gevent的控制超时,如果没有结果返回,会直接切掉连接,并返回一个None 空值。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import  gevent
import  gevent.monkey
import  urllib
import  salt.client
gevent.monkey.patch_all()
                                                                                                                                                                                                                                                                                                                                                                                                                                                              
def  test():
     #就这么用,7是超时时间,后面的False表示不抛出其他异常了!
     with gevent.Timeout( 7 False ) as timeout:
         local  =  salt.client.LocalClient()
          local.cmd( '*' 'cmd.run' , [ 'ip a' ])
                                                                                                                                                                                                                                                                                                                                                                                                                                                              
if  __name__  = =  "__main__" :
     =  gevent.spawn(test)
     g.join()


当然从前端过来的任务用multiprocess的join做超时时间也是可以的。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
from multiprocessing  import  Process
import  os
#xiaorui.cc
def f(mip):
     info( 'function f' )
     print  'hello' , mip
     import  salt.client
     local = salt.client.LocalClient()
     local.cmd( '*' 'cmd.run' , [ 'ip a' ])
if  __name__ ==  '__main__' :
     info( 'main line' )
     p = Process(target=f, args=( '10.58.11.231' ,))
     p.start()
     p.join( 5 )


join([timeout])


父进程被停止,直到子进程被执行完毕。当timeout为None时没有超时,否则有超时。进程可以被join很多次,但不能join自己 !


再给salt他们提提bug,给他们提过好几次类似的问题,还好都解决了。这次看看是啥问题 ~

wKiom1Mkm5ni4MWVAAINDk3iMVM834.jpg


原文:http://rfyiamcool.blog.51cto.com/1030776/1377429

   上面的方法也只是临时的解决,我这里还是希望saltstack快点解决这个bug  ~  另外的是 别总是出新版和大量的新功能更新,还是一步步的来。 步子迈的太大,容易扯到蛋 !




 本文转自 rfyiamcool 51CTO博客,原文链接:http://blog.51cto.com/rfyiamcool/1377429 ,如需转载请自行联系原作者


相关文章
|
前端开发 Java 关系型数据库
SSM住院管理系统
SSM住院管理系统
197 1
SSM住院管理系统
|
9天前
|
数据采集 人工智能 安全
|
5天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
311 164
|
3天前
|
机器学习/深度学习 自然语言处理 机器人
阿里云百炼大模型赋能|打造企业级电话智能体与智能呼叫中心完整方案
畅信达基于阿里云百炼大模型推出MVB2000V5智能呼叫中心方案,融合LLM与MRCP+WebSocket技术,实现语音识别率超95%、低延迟交互。通过电话智能体与座席助手协同,自动化处理80%咨询,降本增效显著,适配金融、电商、医疗等多行业场景。
318 155
|
4天前
|
编解码 人工智能 自然语言处理
⚽阿里云百炼通义万相 2.6 视频生成玩法手册
通义万相Wan 2.6是全球首个支持角色扮演的AI视频生成模型,可基于参考视频形象与音色生成多角色合拍、多镜头叙事的15秒长视频,实现声画同步、智能分镜,适用于影视创作、营销展示等场景。
350 4

热门文章

最新文章