《中国人工智能学会通讯》——12.6 增量序列模式挖掘

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.6节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

12.6 增量序列模式挖掘

在动态更新的流式数据中进行数据挖掘的需求由来已久[34] ,对于序列模式挖掘来说,当数据发生少量更新时对全体数据重新进行挖掘是不可取的。因此,一些增量序列挖掘算法被提出以适应不断增长的数据,这类算法在更新迅速的大数据中显得十分重要。

Parthasarathy 等人[35]提出的 ISM 增量序列模式挖掘算法,基于 SPADE 算法进行扩展,以最小的 I/O 和计算代价处理新增数据。具体地,一种增量序列晶格的结构被用于存储所有频繁序列 , 以及原数据库中位于负边界中的所有序列。这些位于负边界中的序列可能由于新增数据的加入 , 而变成频繁序列模式。Masseglia 等人[36]则提出了一种基于Apriori 思想的增量序列模式挖掘算法 ISE。ISE 利用尽可能少的老频繁序列模式的信息最小化计算代价,挖掘出新增数据中的频繁模式。Cheng 等人[37]提出的 IncSpan,通过维护一个“几乎频繁”的序列集合作为新增数据中可能成为频繁序列模式的候选集 , 高效地进行增量挖掘。Gao 等人[38]则提出了 StreamCloSeq 算法增量,挖掘频繁闭序列模式。

对于频繁情景模式挖掘,Patnaik 等人[39]较早在频繁情景挖掘问题中考虑了数据动态问题。在Patnaik所描述的问题中,事件序列以批量方式更新;然后,对于一段新的事件序列,首先使用已有的频繁情景挖掘算法在增量序列上挖掘候选的情景模式。他们工作的主要贡献是提出了一个频率的下界,凡是频率超过此下界的情景模式很有可能在更新后的序列中是一个 top k 的频繁情景模式。我们[40]率先将频繁情景模式发现算法推广到在线形式,提出的MESELO 算法从动态更新的序列中 , 不断快速地挖掘出最新的频繁情景集合。这里,事件序列总是一个时刻接一个时刻地连续不断更新,而不是批量的更新数据。这个问题中数据更新更快,对算法的响应时间要求更加严格。具体地,在 MESELO 算法中,一种最后情景发生的概念被提出,基于最后情景发生,动态更新的事件序列中的情景最小发生可以快速地被找到。另外,一种高度压缩的场景 trie 则被提出用来高效存储事件序列的更新信息,辅助算法快速计算。MESELO 算法是首个单遍历的频繁情景模式挖掘算法,较传统的方法提高了 1~2 数量级,响应时间通常不超过 1 s。

相关文章
|
6天前
|
人工智能 安全 搜索推荐
AI 驱动研发模式升级,蓝凌软件探索效率提升之道
AI 驱动研发模式升级,蓝凌软件探索效率提升之道
|
3月前
|
存储 机器学习/深度学习 人工智能
【AI系统】微分计算模式
本文深入探讨了自动微分技术,这是AI框架中的核心功能。自动微分分为前向微分和后向微分两种模式,主要通过雅克比矩阵实现。前向模式适用于输出维度大于输入的情况,而后向模式则更适合多参数场景,广泛应用于现代AI框架中。文章还详细解释了这两种模式的工作原理、优缺点及应用场景。
82 2
【AI系统】微分计算模式
|
3月前
|
人工智能 安全 搜索推荐
AI 驱动研发模式升级,蓝凌软件探索效率提升之道
蓝凌软件在引入通义灵码后取得了较明显的效果。目前,蓝凌软件已使用灵码的开发人员中,周活跃用户占比超过90%、根据代码库自动生成的代码占比超33%、代码智能补全占比29%,代码注释率提升了15%,有效提升了产品代码工程化的效能。
|
4月前
|
人工智能 搜索推荐 API
Perplexica:开源 AI 搜索引擎,Perplexity AI 的开源替代品,支持多种搜索模式、实时信息更新
Perplexica 是一款开源的 AI 驱动搜索引擎,支持多种搜索模式和实时信息更新,适用于个人、学术和企业等不同场景。
593 6
Perplexica:开源 AI 搜索引擎,Perplexity AI 的开源替代品,支持多种搜索模式、实时信息更新
|
8月前
|
人工智能 算法 数据可视化
|
3月前
|
人工智能 并行计算 调度
【AI系统】CUDA 编程模式
本文介绍了英伟达GPU的CUDA编程模型及其SIMT执行模式,对比了SIMD和SIMT的特点,阐述了SIMT如何提高并行计算效率和编程灵活性。同时简要提及了AMD的GPU架构及编程模型,包括最新的MI300X和ROCm平台。
121 5
|
4月前
|
人工智能 弹性计算 网络安全
一键玩转CoAI:AI工程变现新模式
CoAI是一款强大的AI管理软件,支持多种大模型如OpenAI、通义千问等,具备丰富的UI设计、多模型管理、弹性计费等功能,既适合个人使用也支持企业级部署,帮助用户轻松管理和商业化AI能力。
|
6月前
|
机器学习/深度学习 人工智能 开发框架
智能ai量化高频策略交易软件、现货合约跟单模式开发技术规则
该项目涵盖智能AI量化高频策略交易软件及现货合约跟单模式开发,融合人工智能、量化交易与软件工程。软件开发包括需求分析、技术选型、系统构建、测试部署及运维;跟单模式则涉及功能定义、策略开发、交易执行、终端设计与市场推广,确保系统高效稳定运行。
|
7月前
|
人工智能 安全 Anolis
中兴通讯分论坛邀您探讨 AI 时代下 OS 的安全能力 | 2024 龙蜥大会
操作系统如何提供符合场景要求的安全能力,构建更加安全可信的计算环境。
|
7月前
|
人工智能 测试技术 持续交付
就AI 基础设施的演进与挑战问题之定义应用的交付模式的问题如何解决
就AI 基础设施的演进与挑战问题之定义应用的交付模式的问题如何解决

热门文章

最新文章