【Online Job和Offline Job】 是Fuxi Job的两种作业类型;对于Offline的作业而言,当每次提交作业时在Fuxi上都会有一个环境准备的时间.对于大数据量并且不需要返回查询结果的作业比较合适。而对于小数据量并且实时作业要求比较高的作业是不合适的。 所以Fuxi提供了ServiceMode这种准实时的作业形式,也是online job,首先会有一个服务去预先申请计算一些资源并加载出来,比如会预先分配一 万个nstance,当有作业提交过来的时候会根据作业规模分配一些Instance进行执行,这样就省去环境准备的时间,所以就会比较快。如果service mode(online)失败,比如instance 个数超过1000,或者运行超过10分钟,就会退回以Offline模式重跑。
【如何更改配置提高速度】
如果想一开始就跑Offline Job
,不跑
Online Job,可以set odps.service.mode=off; 即可直接跑完(不建议关掉online)