Flink-CEP之带版本的共享缓冲区

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 带版本的共享缓冲区 当股票模式以一个事件流作为输入时,状态转换将会作用于事件流从而引起事件的状态变化。结合窗口对参与匹配的事件的限制以及模式中结合事件上下文(状态)的过滤条件,同一事件流随着时间的流动或者多次运行都会产生多种不同的匹配结果。

带版本的共享缓冲区

当股票模式以一个事件流作为输入时,状态转换将会作用于事件流从而引起事件的状态变化。结合窗口对参与匹配的事件的限制以及模式中结合事件上下文(状态)的过滤条件,同一事件流随着时间的流动或者多次运行都会产生多种不同的匹配结果。在此我们为示例模式构建了一个事件流以及其可能产生的三种匹配结果,如下图:

在事件e6到达后,会产生两个结果:R1和R2,而结果R3将会在e8到来之后匹配成功。图中可见R1、R2和R3这三个匹配结果在一些事件上产生了重叠。

为了保留已匹配的结果,需要将匹配结果中包含的事件保存起来,这种数据结构在论文中称之为缓冲区。首先,初步的解决方案是为独立匹配而设计缓冲区,在缓冲区中为了让不同的状态存储不同的事件,每个状态对应一个栈空间(除了最终态),针对上面三个匹配的独立缓冲区如下图a-c所示:

上图中的a-c描述了存储R1-R3三个匹配结果的独立缓冲区。每个栈包含事件和指向事件的指针,它们通常是因为“begin”或者“take”状态转换而被加入到缓冲区中。每个事件有一个前置指针指向之前被选择的事件,之前的事件要么在相同的栈中要么在之前的栈中。当一个事件被加入到缓冲区中,它的指针也一同被设置,在缓冲区中从该事件开始沿着前置指针的一次遍历将能检索到完整的匹配。

为每个匹配单独构建缓冲区,从技术实现上来看是没有问题的,但随着事件的流入,模式的匹配结果也将会变得更多,从而导致缓冲区的数量也极具上升。为了避免缓冲区、栈的数目过多以及在栈中频繁地复制事件,一种优化措施是将这些独立的缓冲区合并为单一共享的缓冲区。这个过程最终是基于合并这些独立缓冲区中相应的栈来实现的。为了在遍历时找到匹配的事件流,合并栈中相同的事件时必须保留他们的前置指针,这一步是整个优化措施的关键,如果草率地合并这些栈中的事件,在共享缓冲区中沿着这些已存在的指针所进行的遍历将会导致错误的结果。举个例子,假设我们将R2的a[i]栈中的e4元素以及b栈中的e6元素与R3缓冲区里的a[i]栈以及b栈合并(来达到合并R1和R2缓冲区的目的),从e6开始的一次遍历会产生包含:e1,e2,e3,e4和e6元素的结果,而这是一个错误的结果。产生这一问题的原因是因为在合并的过程中,没有区分来自不同缓冲区中的不同指针。

为了解决这个问题,

NFAb
设计了一个带版本的共享缓冲区。它会给每一次匹配分配一个版本号并使用该版本号来标记在这次匹配中的所有指针。但这里又会面临另一个问题:无法为某次匹配预分配版本号,因为任何非确定性的状态都能派生出新的匹配。而解决这一问题的技术是采用杜威十进制分类法[^1]来编码版本号,它以
id1
(.
idj
)∗(1≤j≤t)的形式动态增长,这里t关联着当前状态。直观地说,它表示这次运行从
idth1
状态开始被初始化然后到达状态
qj
,并从中分割出
idthj
的实例,这被称之为祖先运行。这种版本号编码技术也保证一个运行的版本号v跟它的祖先运行的版本号兼容。具体而言也就是说:(1)v包含了v’作为前缀或者(2)v与v’仅最后一个数值
idt
不同,而
idt
对于版本v而言要大于版本v’。

在程序实现上,Flink定义了一个DeweyNumber类来表示这种点分十进制形式的版本号,其内部使用数组来存储“点分”的每一个数值并提供了几个对版本号操作的方法。比如,增加版本号:

public DeweyNumber increase() {
    //原样拷贝出一个新数组
    int[] newDeweyNumber = Arrays.copyOf(deweyNumber, deweyNumber.length);
    //最后一个数值加一
    newDeweyNumber[deweyNumber.length - 1]++;

    //构建新数组
    return new DeweyNumber(newDeweyNumber);
}

进入到一个新状态,将新增一位版本号:

public DeweyNumber addStage() {
    //拷贝原先数组的数据,并将数组的容量加1
    int[] newDeweyNumber = Arrays.copyOf(deweyNumber, deweyNumber.length + 1);

    return new DeweyNumber(newDeweyNumber);
}

以及检测当前DeweyNumber与另一个DeweyNumber是否兼容:

public boolean isCompatibleWith(DeweyNumber other) {
    //当前的数值数目多于另一个,则从头开始比对,前缀必须完全相等
    if (length() > other.length()) {
        for (int i = 0; i < other.length(); i++) {
            if (other.deweyNumber[i] != deweyNumber[i]) {
                return false;
            }
        }

        return true;
    } 
    // 数值数目相等,前n-1个必须相等,最后一个数值,当前的必须比另一个大
    else if (length() == other.length()) {
        int lastIndex = length() - 1;
        for (int i = 0; i < lastIndex; i++) {
            if (other.deweyNumber[i] != deweyNumber[i]) {
                return false;
            }
        }

        return deweyNumber[lastIndex] >= other.deweyNumber[lastIndex];
    } 
    //如果当前数值数目比另一个的数值数目少,则明显不兼容
    else {
        return false;
    }
}

�一个带版本的共享缓冲区合并那三个独立缓冲区后的结果如上图中的图(d)所示,所有来自单个缓冲区的指针现在都被标记了兼容的版本号。而之前提到的那个因为不具备版本号而导致遍历产生错误结果的问题在这里也将不再出现,因为从e6指向e4版本号2.0.0跟e4指向e3(处于a[i]栈中)的版本号1.0不兼容,而只有版本号兼容,遍历才会继续。带有版本号的缓冲区对所有的匹配提供简洁的编码,并且被标记了兼容版本号的指针和事件构建了一个满足恰好匹配一次的带版本的视图。为了返回一次匹配成功的结果,检索算法会沿着兼容指针从栈中最近的事件开始遍历。

版本号的实现以及理论分析完成之后,我们来看代码中如何实现这个共享缓冲区。SharedBuffer就是这一数据结构的实现,它是一个嵌套多层略显复杂的数据结构。一个SharedBuffer包含一个键与SharedBufferPage的映射(Map):

SharedBufferPage表示一组拥有相同键的元素的存储。但是元素也是由映射构成的,该映射的键是ValueTimeWrapper类型,而值为SharedBufferEntry类型:

其中ValueTimeWarpper类似于一个封装了值和时间戳的二元组。对于SharedBufferEntry,它保存了一组关联着的SharedBufferEdge。SharedBufferEdge包含指向目标SharedBufferEntry的指针(多个SharedBufferEntry之间的边)以及边上的版本号DeweyNumber。因此,SharedBuffer的整体视图如下所示:

从类图上来展示它们之间的关联关系如下图:

从上面的关系图可见,往SharedBuffer中添加元素如果有前置元素将会涉及到跟前置元素的SharedBufferEntry构建关联关系。因此对于设置元素的put方法被分成了两种情况:

  1. 无前置元素:不需要处理跟之前元素的关系,也不需要初始化对应的SharedBufferEntry;
  2. 有前置元素:需要提供前置元素的信息,并在内部查找到前置元素所对应的SharedBufferEntry,然后再构建ValueTimeWrapper与SharedBufferEntry的映射关系。

通常SharedBuffer如果用户的模式配置了时间窗口,那么它会基于窗口长度来对过期元素进行清理。提供该服务的方法是:prune。该方法会在每个page上进行prune。而在page上的prune则会对其内部Map的每一项的ValueTimeWrapper的时间戳进行比对,凡是小于等于清理时间戳的元素,都予以清理。

另外,由<key, value, timestamp>结合所映射到的SharedBufferEntry,可能会被多次引用(如之前三次匹配中的e4),SharedBuffer采用的是引用计数机制(它是一种资源回收时常用的机制)来标记引用次数。具体而言是由lock、release以及remove这三个方法共同组合来完成这一功能的,而引用计数器实现在SharedBufferEntry上。当然,在删除该SharedBufferEntry时需要一并清除它被其他SharedBufferEdge的引用关系。

为了基于版本号提取某个匹配的的所有元素,Flink定义了一个ExtractionState来存储提取状态的信息,该数据结构内部以栈结构来存储向前遍历的整个路径。下面我们来分析一下,SharedBuffer是如何提取模式的匹配元素,该逻辑被封装在方法extractPatterns中:

public Collection<LinkedHashMultimap<K, V>> extractPatterns(
    final K key,
    final V value,
    final long timestamp,
    final DeweyNumber version) {
    Collection<LinkedHashMultimap<K, V>> result = new ArrayList<>();

    //构建一个栈来记住当前提取的状态
    Stack<ExtractionState<K, V>> extractionStates = new Stack<>();

    //为了构建前置关系,根据键、值以及时间戳获得首个共享缓冲区项
    SharedBufferEntry<K, V> entry = get(key, value, timestamp);

    //如果记录项存在
    if (entry != null) {
        //根据记录项,首先构建一个提取状态加入栈
        extractionStates.add(new ExtractionState<K, V>(entry, version, new Stack<SharedBufferEntry<K, V>>()));

        //当提取状态的栈不为空时,使用深度优先的搜索来重构之前的关系
        while (!extractionStates.isEmpty()) {
            //出栈一个对象
            ExtractionState<K, V> extractionState = extractionStates.pop();
            //获得其版本号
            DeweyNumber currentVersion = extractionState.getVersion();
            //获得其栈来存储当前路径,深度优先搜索
            Stack<SharedBufferEntry<K, V>> currentPath = extractionState.getPath();

            //终止条件:某个提取状态的版本号为单一数值,说明深度搜索已到达头状态
            if (currentVersion.length() == 1) {
                LinkedHashMultimap<K, V> completePath = LinkedHashMultimap.create();

                //出栈构建正向的完整路径存储到LinkedHashMultimap中,并加入到结果集
                while(!currentPath.isEmpty()) {
                    SharedBufferEntry<K, V> currentEntry = currentPath.pop();

                    completePath.put(currentEntry.getKey(), currentEntry.getValueTime().getValue());
                }

                result.add(completePath);
            } else {
                SharedBufferEntry<K, V> currentEntry = extractionState.getEntry();

                //追加到路径中
                currentPath.push(currentEntry);

                boolean firstMatch = true;
                //从当前记录项开始探索与其关联的边,检测版本是否兼容
                for (SharedBufferEdge<K, V> edge : currentEntry.getEdges()) {
                    // 如果版本号兼容
                    if (currentVersion.isCompatibleWith(edge.getVersion())) {
                        //首次匹配,构建提取状态并直接加入栈中,后续匹配需要为提取状态构建新的路径栈,通过深度拷贝路径
                        //因为除了首次匹配路径唯一之外,后续的匹配路径都可能不一致,因此不能共享状态
                        if (firstMatch) {
                            extractionStates.push(
                                new ExtractionState<K, V>(edge.getTarget(), edge.getVersion(), currentPath));
                            firstMatch = false;
                        } else {
                            Stack<SharedBufferEntry<K, V>> copy = new Stack<>();
                            copy.addAll(currentPath);

                            extractionStates.push(
                                new ExtractionState<K, V>(edge.getTarget(), edge.getVersion(), copy));
                        }
                    }
                }
            }
        }
    }

    return result;
}

注意,上面代码段中有两个栈:

  1. extractionStates:类型为Stack<ExtractionState<K, V>>,对当前处理状态压栈,辅助深度遍历;
  2. currentPath:类型为Stack<SharedBufferEntry<K, V>>,保存匹配模式中各状态的“路径”因为是从后往前遍历,所以恰好适合用栈来存储,出栈时正好是顺序的。 

原文发布时间为:2017-03-05
本文作者:vinoYang
本文来自云栖社区合作伙伴 CSDN博客,了解相关信息可以关注CSDN博客。
相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
目录
相关文章
|
8月前
|
SQL 流计算
Flink CDC 1.12版本引入了对SQL Server的支持
【1月更文挑战第26天】【1月更文挑战第124篇】Flink CDC 1.12版本引入了对SQL Server的支持
96 1
|
4月前
|
SQL 消息中间件 关系型数据库
Apache Doris Flink Connector 24.0.0 版本正式发布
该版本新增了对 Flink 1.20 的支持,并支持通过 Arrow Flight SQL 高速读取 Doris 中数据。
|
8月前
|
关系型数据库 Java 分布式数据库
实时计算 Flink版操作报错合集之在使用 Python UDF 时遇到 requests 包的导入问题,提示 OpenSSL 版本不兼容如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
136 5
|
8月前
|
SQL 算法 关系型数据库
实时计算 Flink版产品使用合集之哪个版本支持使用不锁表功能
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
8月前
|
算法 关系型数据库 MySQL
实时计算 Flink版产品使用合集之哪个版本可以做增量快照算法
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
8月前
|
消息中间件 关系型数据库 MySQL
实时计算 Flink版产品使用合集之2.2.1版本同步mysql数据写入doris2.0 ,同步完了之后增量的数据延迟能达到20分钟甚至一直不写入如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
149 1
|
8月前
|
消息中间件 资源调度 分布式计算
实时计算 Flink版产品使用合集之1.13版本上部署一个flink1.17为什么任务启动一直accepted状态yarn的,有什么排查方向吗资源什么的都是充足的
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
8月前
|
Java Maven 流计算
在Docker跑通Flink分布式版本的WordCount
在Docker跑通Flink分布式版本的WordCount
67 0
|
8月前
|
NoSQL Java MongoDB
实时计算 Flink版产品使用合集之在一个任务中创建了多个MySQLCDC源表,这些源表是否共享同一个数据库连接池
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
8月前
|
关系型数据库 MySQL 数据库连接
实时计算 Flink版产品使用合集之是否支持MySQL 5.7以下的版本
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。