好程序员大数据培训分享《MySQL数据库》数据库相关概念及历史发展

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
简介:

  好程序员大数据培训分享《MySQL数据库》数据库相关概念及历史发展

  一、数据存储的历史发展自从人类开启灵智以来,就学会了记录数据,比如远古人用石头在墙壁上画道道用来统计打回来的猎物数量,后来出现了甲骨文用来记录人类的文明发展,再如我们知道的古代人使用竹子,布等充当记录文字的工具。造纸术的发明,大大提高了人类文明的进步,使我们在数据记录和文明传播上更为方便快捷,近代计算机的发明,让我们的世界文明有了质的飞跃,开始进入科技时代。在数据存储上,数据库软件的出现,让我们少了很多在管理数据上的负担。

从数据管理的角度看,数据库技术到目前共经历了手工管理、文件系统和数据库系统三个阶段。

1、手工管理阶段
是指计算机诞生的初期(即20世纪50年代后期之前),这个时期的计算机主要用于科学计算。从硬件看,没有磁盘等直接存取的存储设备;从软件看,没有操作系统和管理数据的软件,数据处理方式是批处理。具有以下特点

(1)数据不保存。只用于科学计算,如在计算某一课题时,将数据输入,用完后不保存原始数据,也不保存计算结果。
(2)没有软件系统对数据进行统一管理。数据的逻辑结构,包括存储结构,存取方式和输入输出方式会随着数据的变化而 变化,数据与程序不具备一致性,无法统一管理。
(3)数据不共享。数据是面向应用的,即使两个应用用到相同的数据,也必须各自定义,组织,数据无法共享。
(4)数据不具有独立性。数据与应用密切相关,应用改变,数据也会跟着变化,因此没有独立性。

2、文件管理
是指计算机不仅用于科学计算,而且还大量用于管理数据的阶段(从50年代后期到60年代中期)。在硬件方面,外存储器有了磁盘、磁鼓等存储设备。在软件方面,操作系统中已经有了专门用于管理数据的软件,称为文件系统。可以总结出以下特点

(1)数据以文件的形式可以长期保存。由于文件概念的引用,数据可以长期保留,因此可以经常对文件进行查询、修改、插 入和删除等反复操作。
(2)由文件系统管理数据。操作系统提供了文件管理系统和访问文件的存取方法,程序和数据之间有了数据存取的接口,程 序可以通过文件名和数据打交道,不必再寻找数据的物理存放位置。
(3)文件形式多样化。文件形式如由顺序文件,索引文件、链表文件等。
(4)数据存取以记录为单位。

尽管文件系统有上述优点,但是,文件系统仍存在缺点,如

(1)数据共享性差,冗余度大
(2)数据独立性差

3、数据库管理
从60年代后期开始,进入数据库管理阶段。在这一阶段中,数据库中的数据不再是面向某个应用或某个程序,而是面向整个企业(组织)或整个应用的。数据库系统阶段的特点如下

(1)面向数据模型化。这个时期,数据库系统不仅可以描述数据本身,还可以描述数据之间的复杂关系。
(2)较高的数据独立性。数据和程序彼此独立,数据存储结构的变化,尽量不影响用户的使用。
(3)冗余度低。数据库系统中的重复数据被减少到最低程度,这样,在有限的存储空间内可以存放更多的数据并减少存取时 间。
(4)数据由DBMS统一管理和控制。数据库系统具有数据的安全性,以防止数据的丢失和被非法使用;具有数据的完整性, 以保护数据的正确、有效和相容;具有数据的并发控制,避免并发程序之间的相互干扰;具有数据的恢复功能,在数据 库被破坏或数据不可靠时,系统有能力把数据库恢复到最近某个时刻的正确状态

二、数据库的相关概念
1、数据库

英文名Database,简称DB。是按照某一特定的数据结构来组织、存储和管理数据的仓库。

2、数据库管理系统

英文名Database Management System,简称DBMS。是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。它介于用户和数据库之间。用户通过DBMS来访问数据库中的数据。
_2

三、表的概念
1、数据表(table),是关系型数据库的基本存储结构。一个关系型数据库是由多个表组成的。
2、数据表是二维的,它由纵向的列和横向的行组成。
3、数据表的行(Row)是横排数据,也被称之为记录(Recond)。
4、数据表的列(Column)是竖排数据,也被称之为字段(Field)。
5、表与表之间也可能存在着关系。

例如一个有关学生信息的名为 students 的表中,每个列包含的是所有学生的某个特定类型的信息,比如“姓名”,而每行则包含了某个特定学生的所有信息:姓名、学号、专业,院校等等。

对于数据表来说,列的数目一般事先固定,各列之间可以由列名来识别;而行的数目可以随着时间,动态变化。每行通常都可以根据某个或某几个列中的数据来识别。

四、关系型数据库
首先,我们需要了解一个名词“关系模型”的概念。所谓关系模型,就是指二维表格结构,即表的行与列的关系。比如设计教师信息的关系模型,就是一条记录表示一个教师的信息,而这条记录中每个字段表示这个教师的特定信息。教师(教师编号,姓名,年龄,性别,科目)。

关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据;一个关系型数据库是由二维表及其之间的联系组成的一个数据组织。现实世界中的各种实体以及实体之间的各种联系,我们均可以使用关系模型来表示。

当前主流的关系型数据库有Oracle、DB2、Sybase、Microsoft SQL Server、Microsoft Access、MySQL等。

Oracle数据库,是著名的Oracle(甲骨文)公司旗下的数据库产品,是世界上第一个商品化的关系型数据库管理系统,采用标准SQL,支持多种数据类型,提供面向对象的数据支持,支持unix,windows,os/2等多种平台。目前最新版本oracle 12.2c。
DB2,是IBM公司的关系型数据库管理系统。有很多不同的版本,可以运行在从掌上产品到大型机不同的终端及其上。是oracle的主要竞争对手。
Sybase,是Sybase公司的数据库产品,2010年被SAP收购。
SQL Server,是微软旗下的产品,运行在windows NT服务器上。现在的应用领域越来越大。
Microsoft Office Access,是由微软发布的关系数据库管理系统。它结合了 MicrosoftJet Database Engine 和 图形用户界面两项特点,是 Microsoft Office 的系统程序之一。
MySQL,是开放源码的小型数据库管理系统,最开始是瑞典的MySQLAB公司的产品,后来被Sun公司收购,在2009年4月20号Sun公司被Oracle收购。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3月前
|
存储 分布式计算 大数据
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
大数据-169 Elasticsearch 索引使用 与 架构概念 增删改查
81 3
|
3月前
|
消息中间件 分布式计算 关系型数据库
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
73 0
|
3月前
|
消息中间件 分布式计算 大数据
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
大数据-123 - Flink 并行度 相关概念 全局、作业、算子、Slot并行度 Flink并行度设置与测试
202 0
|
3月前
|
消息中间件 关系型数据库 MySQL
大数据-117 - Flink DataStream Sink 案例:写出到MySQL、写出到Kafka
大数据-117 - Flink DataStream Sink 案例:写出到MySQL、写出到Kafka
285 0
|
23天前
|
存储 人工智能 数据管理
|
16天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
3月前
|
数据采集 数据可视化 大数据
大数据体系知识学习(三):数据清洗_箱线图的概念以及代码实现
这篇文章介绍了如何使用Python中的matplotlib和numpy库来创建箱线图,以检测和处理数据集中的异常值。
81 1
大数据体系知识学习(三):数据清洗_箱线图的概念以及代码实现
|
3月前
|
算法 大数据 数据库
云计算与大数据平台的数据库迁移与同步
本文详细介绍了云计算与大数据平台的数据库迁移与同步的核心概念、算法原理、具体操作步骤、数学模型公式、代码实例及未来发展趋势与挑战。涵盖全量与增量迁移、一致性与异步复制等内容,旨在帮助读者全面了解并应对相关技术挑战。
70 3
|
3月前
|
机器学习/深度学习 XML 分布式计算
大数据的概念
【10月更文挑战第16天】
142 4
|
3月前
|
消息中间件 NoSQL Kafka
大数据-116 - Flink DataStream Sink 原理、概念、常见Sink类型 配置与使用 附带案例1:消费Kafka写到Redis
大数据-116 - Flink DataStream Sink 原理、概念、常见Sink类型 配置与使用 附带案例1:消费Kafka写到Redis
246 0