Apache OpenWhisk架构概述

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
注册配置 MSE Nacos/ZooKeeper,118元/月
简介: 本文讲的是Apache OpenWhisk架构概述【编者的话】Apache OpenWhisk是一个开源FaaS平台。现在,AWS Lambda是FaaS最流行的实现。 在开源组件的选择中,OpenWhisk是最好的选择。
本文讲的是Apache OpenWhisk架构概述【编者的话】Apache OpenWhisk是一个开源FaaS平台。现在,AWS Lambda是FaaS最流行的实现。 在开源组件的选择中,OpenWhisk是最好的选择。OpenWhisk是一个健壮的、可扩展的平台,支持数千并发触发器和调用。这篇文章将探索OpenWhisk设计和架构,识别各种组件及其作用,可以帮助我们更好的了解分布式系统和serverless平台。

【3 天烧脑式 Docker 训练营 | 上海站】随着Docker技术被越来越多的人所认可,其应用的范围也越来越广泛。本次培训我们理论结合实践,从Docker应该场景、持续部署与交付、如何提升测试效率、存储、网络、监控、安全等角度进行。

Apache OpenWhisk 是一个由IBM和Adobe驱动的开源项目,它是一个健壮的FaaS平台,可以部署在云或数据中心内。相比其他 serverless 项目, OpenWhisk 是一个健壮的、可扩展的平台,支持数千并发触发器和调用。

你可以使用 Bluemix 托管版本的OpenWhisk或在 自己的开发机器 上部署基于Vagrant的OpenWhisk环境。在本文中,我们将探索OpenWhisk的设计和架构,识别各种组件及其作用。

要获得最佳的指南,建议在自己的机器上部署基于 Vagrant 的OpenWhisk环境。OpenWhisk的CLI,wsk应该配置本地的设置。

架构的快速回顾

Apache OpenWhisk旨在作为异步和松耦合的执行环境,可以基于外部触发器运行功能。开发人员编写独立的功能,作为操作上传,完全独立于事件源。事件源通过必不可少的正确的参数集调用操作。 

一旦操作就位,开发人员就可以创建触发器。触发器是事件源显式调用端点,事件源如:数据库、流处理引擎、文件系统和业务应用程序等。一个操作独立于触发器,这意味着触发器可能或可能没有任何操作绑定。当事件源触发一个触发器时,可能不知道被调用的操作。绑定到触发器的操作集只在运行时被发现和执行。

但是,开发人员如何使用触发器绑定操作?这就出现了规则。规则作为触发器和操作之间的粘合,在触发器和操作之间创建松耦合的关联。该设计模式使得相同的操作可以被不同的触发器调用。
c62548ae-ow-arch-1.png

这种松耦合的架构使OpenWhisk成为可扩展、可靠和强大的无服务器平台。 执行的每个层都被设计成独立扩展。

操作、规则和触发器可以通过REST端点创建和管理。 事件源调用一个操作所需要做的就是调用触发器的REST API。

下面是演示的工作流程,突出了创建和调用代码的简单而强大的机制:
$ cat > hello.js << EOF

function main() {

console.log('Hello World');

return {msg: 'Hello World'};

}

EOF

$ wsk -i action create helloAction hello.js

ok: created action helloAction

$ wsk -i trigger create helloTrigger

ok: created trigger helloTrigger

$ wsk -i rule create helloRule helloTrigger helloAction

ok: created rule helloRule

$ wsk -i trigger fire helloTrigger

ok: triggered /guest/helloTrigger with id 350364de139547ba8c95113ef0908911

OpenWhisk的构建模块

现在来看看OpenWhisk的核心组件。

下图描绘了OpenWhisk的架构。 从Nginx到Kafka到Docker,这个serverless平台使用多种技术。
2ae03e6a-ow-arch-2.png

通过访问Vagrant Box,使用SSH去检查运行的Docker容器和拉取的图像:
$ docker ps --format "{{.Names}} - {{.Image}}"

wsk0_425_warmJsContainer_20170202T014345371Z - whisk/nodejs6action:latest

wsk0_424_warmJsContainer_20170202T014153330Z - whisk/nodejs6action:latest

nginx - nginx:1.11

invoker0 - whisk/invoker:latest

controller - whisk/controller:latest

kafka - ches/kafka:0.10.0.1

zookeeper - zookeeper:3.4

registrator - gliderlabs/registrator

consul - consul:0.7.0

couchdb - couchdb:1.6

前两个容器代表最近被调用的操作,而其他容器则直接映射到核心组件。下面让我们了解每个组件的作用。

Nginx

这个 开源Web服务器 暴露HTTP(S)端点给客户端。它主要用做API的反向代理以及终止SSL连接。每个进入OpenWhisk基础架构的请求,包括那些源自wsk CLI的请求,都通过该层。由于它是完全无状态的,所以Nginx层可以轻松扩展。

控制器

在通过反向代理的请求之后,会触发控制器,该控制器充当系统的守门员。在Scala中,该组件负责OpenWhisk API的实际实现。在将控件交给下一个组件之前,它会执行每个请求的身份验证和授权。控制器被认为是系统的协调者,它将决定请求最终采取的路径。

CouchDB

系统的状态在 CouchDB (一个开源JSON数据存储)中进行维护和管理。凭证、元数据、命名空间以及操作、触发器和规则的定义存储在CouchDB中。控制器根据存储在此数据库中的凭证识别凭证。

可以通过访问 http://192.168.33.13:5984/_utils/ (链接仅在开发者机器上使用)从浏览器访问数据库。
69e516f6-ow-arch-couchdb.png


查看创建的初始的操作、触发器和规则集 http://192.168.33.13:5984/_uti ... hisks
71f7db81-ow-arch-couchdb-1.png

helloAction的源代码也保留在CouchDB中,包括操作的定义、默认参数和所分配的资源配额:
c34793cc-ow-arch-couchdb-2.png

OpenWhisk中的每次调用都会导致一个激活,它包含Action的输出。 例如,以下命令异步调用helloAction导致新的激活ID:
$ wsk -i action invoke helloAction

ok: invoked /guest/helloAction with id 8004746e06f147b99c1e8b0be875ec64

The output of this invocation can be retrieved through the following command.

$ wsk -i activation get --summary 8004746e06f147b99c1e8b0be875ec64

activation result for /guest/helloAction (success at 2017-02-02 08:01:46 +0530 IST)

{

"msg": "Hello World"

}    

如下是存储在CouchDB中的输出。
c2e16397-ow-arch-couchdb-3.png

Consul

OpenWhisk、Kubernetes和Swarm这样的现代分布式计算平台依靠分布式键/值存储进行状态管理。 OpenWhisk使用Consul作为系统每个组件可访问的单一数据源。 同时,consul还提供服务发现功能,使控制器发现调用操作的实体。 这些实体被称为调用者(Invokers),它们直接负责执行代码。 Consul拥有可用的调用者及其健康状况清单。

Consul支持注册者Registrator,注册者可以观看新的Docker容器,并检查他们,决定他们提供的服务。 当Docker引擎创建一个新的容器时,注册者会收到被推入Consul的事件。

当Controller需要将操作委派给调用者时,它会在Consul列表中查找合适的候选人。

Consul的UI http://192.168.33.13:8500/ui/#/dc1/services
02249ef4-ow-arch-consul.png

查看可用的调用者: http://192.168.33.13:8500/ui/#/dc1/kv/invokers/
c7b91496-ow-arch-consul-1.png

Kafka

Apache Kafka 通常用于构建实时数据管道和流应用程序。它支持需要可靠、高速数据摄取的生产工作负载。 OpenWhisk利用Kafka连接控制器和调用者。

kafka缓存由控制器发送的消息,然后再将它们传递给上节的Consul的调用者。当kafka确认消息被传递时,控制器立即用激活ID进行响应。这种无状态架构使OpenWhisk具有高度可扩展性。

Apache ZooKeeper 维护和管理Kafka集群。 Zookeeper的主要工作是跟踪Kafka群集中存在的节点的状态,并跟踪主题、消息和配额。

调用者(Invoker)

调用者使用Scala实现,调用者是处理执行过程的最后阶段。基于运行时的要求和配额分配,会自动创建一个新的Docker容器,作为所选操作的执行单位。 调用者从CouchDB复制源代码,并将其注入Docker容器。一旦执行完成,它将激活的结果存储在CouchDB中,以便将来检索。 调用者决定重新使用现有的“热”容器,或启动一个暂停的“暖”容器,或启动一个新的“冷”容器进行新的调用。它会查询Conusl的容器状态以进行适合的调用。

可能有多个调用者取决于平台的负载和利用率。

根据元数据,调用者会选择要使用的容器图像。以下是调用helloAction的两个容器。
$ docker ps --format "{{.Names}} - {{.Image}}"| grep "JsContainer"

wsk0_457_warmJsContainer_20170202T035154330Z - whisk/nodejs6action:latest

wsk0_456_warmJsContainer_20170202T035037341Z - whisk/nodejs6action:latest   

Docker

Apache OpenWhisk建立在一些开源技术基础上,Docker起着非常重要的作用。 几乎所有的OpenWhisk组件都打包和部署为容器。 从Nginx到kafka到consul,平台运行都是容器。可以通过 Docker hub 查询OpenWhisk镜像列表。

即将到来:API网关

虽然没有完全集成,OpenWhisk也有一个内置的API网关负责暴露操为HTTP端点。 基于Openresty的Nginx,此项目是由Adobe维护的开源项目。 目前这种能力是可用的实验功能,以下命令显示了可能的选项:
$ wsk -i api-experimental

work with APIs

Usage:

wsk api-experimental [command]


Available Commands:

create      create a new API

get         get API details

delete      delete an API

list        list APIs

总结

OpenWhisk是一个吸引人的项目去了解分布式系统和serverless平台。 感谢IBM和Adobe捐赠到Apache基金会,鼓励社区参与。 最近,尽管许多开源serverless平台如雨后春笋般涌现,而OpenWhisk以健壮的架构和设计的脱颖而出。

在开源组件的选择中,OpenWhisk是最好的选择,贡献总体成功的平台。 希望看到在未来几个月增加采用OpenWhisk。 并关注整合OpenWhisk与流行的数据库、存储引擎和API网关。

原文链接:An Architectural View of Apache OpenWhisk(翻译:范彬)

===============================================================

译者介绍:范彬,从事微服务、Docker和Kubernetes容器技术等方面的工作。可以关注译者的微信公众号:范范米饭。

原文发布时间为:2017-06-08

本文作者:范彬

本文来自云栖社区合作伙伴Dockerone.io,了解相关信息可以关注Dockerone.io。

原文标题:Apache OpenWhisk架构概述


相关文章
|
3月前
|
存储 分布式计算 API
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
144 0
|
25天前
|
存储 消息中间件 缓存
独特架构打造新一代消息队列Apache Pulsar
Apache Pulsar 是一个开源的分布式消息流平台,由雅虎开发并于 2016 年开源,2018 年成为 Apache 顶级项目。Pulsar 通过独特的架构提供多租户、持久化存储和批处理等高级功能,支持高吞吐量、低延迟的消息传递。其核心组件包括 Broker、Apache BookKeeper 和 Apache ZooKeeper,分别负责消息处理、持久化存储和集群管理。
56 1
|
2月前
|
存储 SQL Apache
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
Apache Doris 是一个基于 MPP 架构的高性能实时分析数据库,以其极高的速度和易用性著称。它支持高并发点查询和复杂分析场景,适用于报表分析、即席查询、数据仓库和数据湖查询加速等。最新发布的 2.0.2 版本在性能、稳定性和多租户支持方面有显著提升。社区活跃,已广泛应用于电商、广告、用户行为分析等领域。
Apache Doris 开源最顶级基于MPP架构的高性能实时分析数据库
|
2月前
|
分布式计算 大数据 Apache
Apache Spark & Paimon Meetup · 北京站,助力 LakeHouse 架构生产落地
2024年11月15日13:30北京市朝阳区阿里中心-望京A座-05F,阿里云 EMR 技术团队联合 Apache Paimon 社区举办 Apache Spark & Paimon meetup,助力企业 LakeHouse 架构生产落地”线下 meetup,欢迎报名参加!
114 3
|
2月前
|
存储 监控 Linux
Docker技术架构概述
【10月更文挑战第22天】Docker采用CS架构,Client与Daemon交互,Compose管理多容器应用。
|
3月前
|
SQL 存储 分布式计算
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
54 9
|
3月前
|
存储 分布式计算 druid
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
80 3
|
3月前
|
存储 SQL 缓存
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
从 3.0 系列版本开始,Apache Doris 开始支持存算分离模式,用户可以在集群部署时选择采用存算一体模式或存算分离模式。基于云原生存算分离的架构,用户可以通过多计算集群实现查询负载间的物理隔离以及读写负载隔离,并借助对象存储或 HDFS 等低成本的共享存储系统来大幅降低存储成本。
Apache Doris 3.0 里程碑版本|存算分离架构升级、湖仓一体再进化
|
3月前
|
消息中间件 分布式计算 druid
大数据-154 Apache Druid 架构与原理详解 基础架构、架构演进
大数据-154 Apache Druid 架构与原理详解 基础架构、架构演进
86 2
|
3月前
|
存储 消息中间件 druid
大数据-150 Apache Druid 安装部署 单机启动 系统架构
大数据-150 Apache Druid 安装部署 单机启动 系统架构
61 1

推荐镜像

更多