现实世界中,写一个函数,做一个系统,会发现这个系统提供对外一些 API 输入数据, 然后系统做一些逻辑,逻辑之后又输出,可能输出到下一个处理环节,如果是数据库就存在 数据库里面。输入的地方也是一样,假设是一个 rest API,接受外围的请求,处理,输出, 返回数据,假如是一个大数据里面的离线计算批处理,也是写一个批处理逻辑输入数据,比 如 Spark 读取文件,然后做计算,输出,可能又存到输入上去了,或者是输到 ES。如果 这一步完成了,我们在大数据里面经常还要做调度编排,一般会用 Airflow 去完成,在编写 Airflow 流程的时候,实际上是编写一个一个流的方式,然后把它挪到下面去,再输入到下一个逻辑。
资料来源于《开源与云Elasticsearch应用剖析》下载地址:https://developer.aliyun.com/topic/download?id=1169
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。