学习 MongoDB:打开强大的数据库技术大门

简介: MongoDB 是一个基于分布式文件存储的文档数据库,由 C++ 编写,旨在为 Web 应用提供可扩展的高性能数据存储解决方案。它与 MySQL 类似,但使用文档结构而非表结构。核心概念包括:数据库(Database)、集合(Collection)、文档(Document)和字段(Field)。MongoDB 使用 BSON 格式存储数据,支持多种数据类型,如字符串、整数、数组等,并通过二进制编码实现高效存储和传输。BSON 文档结构类似 JSON,但更紧凑,适合网络传输。

一、基本概念

MongoDB 是一个基于分布式文件存储的文档数据库,由 C++ 语言编写。它旨在为 Web 应用提供可扩展的高性能数据存储解决方案。

相信MySQL我们非常的熟悉,那么MySQL的表结构与MongoDB的文档结构进行类比的话可能更好理解MongoDB。


添加图片注释,不超过 140 字(可选)


  • MySQL的数据库(Database)对应于MongoDB的数据库。
  • MySQL的表(Table)对应于MongoDB的集合(Collection)。
  • MySQL的行(Row)对应于MongoDB的文档(Document)。
  • MySQL的列(Column)对应于MongoDB文档中的字段(Field)。

在MongoDB中,数据库(database)、集合(collection)、文档(document)、字段(field)是构成数据存储和管理的核心概念。以下是它们的基本定义和关系:

1.1、数据库(Database):

  • 数据库是MongoDB中的顶层容器,用于存储一组相关联的集合。
  • 每个数据库都有自己的权限和独立的命名空间,可以包含多个集合。
  • 数据库的名称是字符串,可以通过use命令在MongoDB中切换到指定的数据库。

use mydatabase

1.2、集合(Collection):

  • 集合是MongoDB中的一个文档组,类似于关系型数据库中的表。
  • 集合包含多个文档,每个文档可以有不同的结构,无需事先定义表结构。
  • 集合的名称是字符串,区分大小写。

db.createCollection("mycollection")

1.3、文档(Document):

  • 文档是MongoDB中的基本数据单元,用于表示数据记录。
  • 文档是一个键值对的有序集合,以BSON(Binary JSON)格式存储。
  • 文档可以包含嵌套文档和数组,支持复杂的数据结构。

{     "_id": ObjectId("5f5a8b6d9df1a83a8b1c4a3"),     "name": "John Doe",     "age": 30,     "address": {         "city": "New York",         "zipcode": "10001"     },     "hobbies": ["reading", "traveling"] }

1.4、字段(Field):

  • 字段是文档中的一个键值对,表示文档的属性或属性值。
  • 字段的键是字符串,字段的值可以是各种数据类型,包括字符串、整数、数组、嵌套文档等。

{     "name": "John Doe",     "age": 30,     "address": {         "city": "New York",         "zipcode": "10001"     },     "hobbies": ["reading", "traveling"] }


二、数据结构

BSON(Binary JSON)是MongoDB使用的二进制数据表示格式,它是一种轻量级、可扩展的数据交换格式。BSON主要用于在MongoDB中存储和传输数据。以下是关于BSON的一些重要特点和使用方式:

  1. 数据类型:
  • BSON支持多种数据类型,包括字符串、整数、浮点数、日期、数组、嵌套文档、ObjectId等。
  • 数据类型的使用使得BSON可以准确地表示MongoDB文档中的各种数据。
  1. 二进制编码:
  • BSON使用二进制格式进行编码,使得数据在存储和传输时更加紧凑和高效。
  • 二进制编码还支持复杂数据类型,如嵌套文档和数组。
  1. ObjectId:
  • ObjectId是BSON的一部分,用于唯一标识MongoDB文档。
  • ObjectId由12字节组成,包括时间戳、机器ID、进程ID和随机数,以保证在分布式系统中的唯一性。
  1. 日期表示:
  • BSON支持日期类型,可以精确表示日期和时间。
  • 日期以UTC时间存储,使得在不同时区之间的数据交换更为方便。
  1. BSON文档结构:
  • BSON文档的基本结构与JSON相似,但包含了更多的数据类型和二进制编码。
  • BSON文档由多个字段组成,每个字段包含键值对,键是字符串,值可以是各种数据类型。
  1. BSON与JSON的关系:
  • BSON可以看作是JSON的二进制扩展,支持JSON的大部分数据类型。
  • BSON的二进制格式比JSON更紧凑,更适合在网络传输和存储中使用。

下面是一个简单的BSON文档的示例,以展示其基本结构:

{    "_id": ObjectId("5f5a8b6d9df1a83a8b1c4a3"),    "name": "John Doe",    "age": 30,    "address": {        "city": "New York",        "zipcode": "10001"    },    "hobbies": ["reading", "traveling"] }




目录
相关文章
|
2天前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
|
9天前
|
存储 运维 安全
云上金融量化策略回测方案与最佳实践
2024年11月29日,阿里云在上海举办金融量化策略回测Workshop,汇聚多位行业专家,围绕量化投资的最佳实践、数据隐私安全、量化策略回测方案等议题进行深入探讨。活动特别设计了动手实践环节,帮助参会者亲身体验阿里云产品功能,涵盖EHPC量化回测和Argo Workflows量化回测两大主题,旨在提升量化投研效率与安全性。
云上金融量化策略回测方案与最佳实践
|
11天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
8878 20
|
15天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
4769 12
资料合集|Flink Forward Asia 2024 上海站
|
15天前
|
自然语言处理 数据可视化 API
Qwen系列模型+GraphRAG/LightRAG/Kotaemon从0开始构建中医方剂大模型知识图谱问答
本文详细记录了作者在短时间内尝试构建中医药知识图谱的过程,涵盖了GraphRAG、LightRAG和Kotaemon三种图RAG架构的对比与应用。通过实际操作,作者不仅展示了如何利用这些工具构建知识图谱,还指出了每种工具的优势和局限性。尽管初步构建的知识图谱在数据处理、实体识别和关系抽取等方面存在不足,但为后续的优化和改进提供了宝贵的经验和方向。此外,文章强调了知识图谱构建不仅仅是技术问题,还需要深入整合领域知识和满足用户需求,体现了跨学科合作的重要性。
|
23天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
11天前
|
人工智能 容器
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
本文介绍了如何利用千问开发一款情侣刮刮乐小游戏,通过三步简单指令实现从单个功能到整体框架,再到多端优化的过程,旨在为生活增添乐趣,促进情感交流。在线体验地址已提供,鼓励读者动手尝试,探索编程与AI结合的无限可能。
三句话开发一个刮刮乐小游戏!暖ta一整个冬天!
|
10天前
|
消息中间件 人工智能 运维
12月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
878 58

热门文章

最新文章