MongoDB 功能详解之时间序列集合(Time Series Collections)

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: 时间序列集合(Time Series Collections):MongoDB 5.0 版本中的新功能。

时间序列数据是一系列数据点,通过分析这些随时间变化的数据点而获得对数据的深刻理解。

时间序列数据通常由以下组成部分组成:

  • 时间:数据点何时被记录
  • 元数据(有时称为源):一个标签或标记,唯一标识一个序列,并且很少更改
  • 测量值(有时称为指标或值):按时间增量跟踪的数据点,通常是随时间变化的键-值对。


下表列出了一些时间序列数据的例子:

示例

测量值

元数据

股票数据

股票价格

证券报价机,交易所

天气数据

温度

传感器标识,位置

网站访问者

访问次数

URL

为了高效的存储时间序列数据,MongoDB 提供了时间序列集合。


时间序列集合


时间序列集合高效地存储时间序列数据。在时间序列集合中,会对写操作进行组织,以便将来自同一个源的相近时间点的数据存储在一起。


好处

相比普通集合,将时间序列数据存储在时间序列集合中可以提高查询效率,并且减少时间序列数据和二级索引(secondary indexes)的磁盘使用量。

时间序列集合底层使用列式存储格式,并使用自动创建的聚集索引(clustered index)按时间顺序存储数据。列式存储格式提供以下好处:

降低了处理时间序列数据的复杂性

提高查询效率

降低磁盘使用量

减少了读操作的 I/O

提升了 WiredTiger 缓存的使用


行为

时间序列集合的行为类似普通集合。你可以像普通集合一样插入和查询数据。


MongoDB 将时间序列集合视为由内部集合支持的可写非物化视图。插入数据时,内部集合自动将时间序列数据组织成优化的存储格式。


在查询时间序列集合时,每个测量值查询一个文档。对时间序列集合的查询利用了优化的内部存储格式,能更快地返回结果。


⚠️ 重要:

不向后兼容的特性

在降级之前,必须删除时间序列集合:

  • MongoDB 6.0 或更高版本降到 MongoDB 5.0.7 或更早。
  • MongoDB 5.3 降到MongoDB 5.0.5或更早。


内部索引

当你创建一个时间序列集合时,MongoDB 会自动在时间字段上创建一个内部聚集索引(clustered index)。内部索引提供了一些性能优势,包括提高查询效率和减少磁盘使用。要了解关于聚集索引性能优势的更多信息,请参阅聚集集合(Clustered Collections)

listIndexes 不会显示时间序列集合的内部索引。


📒 TIP:为了提高查询性能,你可以手动在测量字段或时间序列集合中的任何字段上添加二级索引


文章来源于Mongoing中文社区。

要开始使用时间序列集合,请参阅文档:创建并查询时间序列集合

原文:Time Series

关于译者;张清荣,MongoDB 中文社区成员,现就职于中国联通软件研究院。


扫码加入钉群,与MongoDB专家一对一沟通,了解更多阿里云MongoDB产品与方案,市场活动及线上培训等内容。

image.png


相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
5月前
|
Oracle NoSQL 关系型数据库
实时计算 Flink版产品使用合集之MongoDB CDC connector的全量快照功能可以并发读取吗
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
111 2
|
2月前
|
存储 NoSQL 数据管理
揭秘MongoDB时间序列集合:这个超级功能将如何彻底改变你的数据管理?
【8月更文挑战第8天】时间序列数据记录随时间变化的信息,在数据库管理中至关重要。MongoDB自4.0版起引入时间序列集合,专为这类数据优化存储与查询。通过问答形式介绍其特点:自动数据过期、高效存储机制及快速查询操作。创建时需指定时间字段及可选元数据字段。支持设置数据过期时间,采用粗粒度索引减少I/O操作。查询时可通过时间范围筛选数据,并利用聚合框架进行数据分析。随着实时分析需求的增长,时间序列集合的应用将更加广泛。
77 0
|
4月前
|
存储 负载均衡 NoSQL
MongoDB的分片功能
【6月更文挑战第6天】MongoDB的分片功能
45 1
|
4月前
|
NoSQL 安全 MongoDB
精准数据清理:掌握 MongoDB 删除集合的方法与最佳实践
精准数据清理:掌握 MongoDB 删除集合的方法与最佳实践
|
4月前
|
存储 NoSQL MongoDB
MongoDB 集合创建指南:命名规范、索引优化和数据模型设计
MongoDB 集合创建指南:命名规范、索引优化和数据模型设计
|
5月前
|
分布式计算 DataWorks NoSQL
DataWorks产品使用合集之在 DataWorks 中,离线同步的一键生成目标表结构功能不能识别 MongoDB 数据源如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
52 0
|
10月前
|
存储 人工智能 NoSQL
MongoDB推出高级数据管理功能,实现随处可运行应用程序
借助MongoDB Atlas for the Edge,企业不仅可以安全地存储数据,还可以跨越不同数据源和目的地实时同步数据,从而提供具有高可用性、高弹性和高可靠性的应用程序
|
11月前
|
NoSQL 测试技术 API
Eolink Apikit 版本更新:「数据字典」功能上线、支持 MongoDB 数据库操作...
Eolink Apikit 版本更新: 1. 搭建自定义接口协议架构,支持快速适配金融行业各类型私有协议的导入、编辑和展示。 2. 数据字典功能上线,支持以数据字典的形式管理参数枚举值。 3. 数据库连接支持 MongoDB 数据库操作。 4. 基于 Apikit 类型导入 API 数据支持增量更新。
70 0
|
11月前
|
NoSQL MongoDB 数据库
04 MongoDB - 集合操作
04 MongoDB - 集合操作
46 0
|
NoSQL MongoDB 数据库
MongoDB常用的操作(服务器、数据库、集合)
MongoDB常用的操作(服务器、数据库、集合)
2407 0

相关产品

  • 云数据库 MongoDB 版
  • 下一篇
    无影云桌面