数据库基础知识(上)

简介: 数据库基础知识

1. 基本概念

数据库技术是研究数据库的结构、存储、设计、管理和应用的一门软件学科。

数据库系统本质上是一个用计算机存储信息的系统。

数据库管理系统是位于用户与操作系统之间的一层数据管理软件,其基本目标是为用户提供一个可以方便、有效地存取数据库信息的环境。

数据库就是信息的集合,它是收集计算机数据的仓库或容器,用户可以对这些数据执行一系列操作, 以获取所需的数据。

设计数据库系统是为了管理大量信息,给用户提供数据的抽象视图,即系统隐藏有关数据存储和维护的某些细节。对数据的管理涉及信息存储结构的定义,信息操作机制的提供,安全性保证,以及多用户对数据的共享问题。

1.1 组成和发展

数据(data)是描述事物的符号记录,它具有多种表现形式,可以是文字、图形、图像、声音和语言等 。信息(information)是现实世界事物的存在方式或状态的反映。信息具有可感知、可存储、可加工、可传递和可再生等自然属性,数据是信息的符号表示,而信息是具有特定释义和意义的数据。

数据库系统(DataBaseSystem,DBS)是 一个采用了数据库技术,有组织地、动态地存储大量相关联数据,方便多用户访问的计算机系统。广义上讲,DBS是由数据库、硬件、软件和人员组成的。

数据库(DataBase,DB)。数据库是统一管理的、长期储存在计算机内的、有组织的相关数据的集合,是指有组织地、动态地存储在外存上的相互联系的数据的集合。其特点是数据间联系密切、余度小、独立性较高、易扩展,并且可为各类用户共享

硬件(Hardware)。硬件是构成计算机系统的各种物理设备,包括存储数据所需的外部设备。硬件的配置应满足整个数据库系统的需要。

软件(software)。软件包括操作系统、数据库管理系统及应用程序。数据库管理系统(DataBase Management System,DBMS)是数据库系统的核心软件,是由一组相互关联的数据的集合和一组用以访问这些数据的软件组成。

人员。第一类为系统分析员和数据库设计人员,系统分析员负责应用系统的需求分析和规范说明,他们和用户及数据库管理员一起确定系统的硬件配置,并参与数据库系统的概要设计;数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。第二类为应用程序员,负责编写使用数据库的应用程序,这些应用程序可对数据进行检索、建立、删除或修改。第三类为最终用户,他们应用系统的接又或利用查询语言访问数据库。第四类用户是数据库管理员(DataBase Administrator,DBA),负责数据库的总体信息控制。DBA的具体职责包括决定数据库中的信息内容和结构;决定数据库的存储结构和存取策略;定义数据库的安全性要求和完整性约束条件;监控数据库的使用和运行;数据库的性能改进、数据库的重组和重构,以提高系统的性能。


数据库系统的应用很广泛,典型的应用有:金融业、销售业、银行业、航空业、制造业、人力资源、高校等。


数据管理技术发展经历了三个阶段:人工管理、文件系统和数据库系统阶段。


数据库的研究领域有数据库管理系统软件的研制、数据库设计、数据库理论。


DBMS 的研制包括研制 DBMS 本身以及以 DBMS 为核心的一组相互联系的软件系统,包括工具软件和中间件。研制的目标是提高系统的可用性、可靠性、可伸缩性,提高性能和提高用户的生产率。

数据库设计的主要任务是为某一部门或组织设计一个结构合理、使用方便、效率较高的数据库及其应用系统。其中主要的研究方向是数据库设计方法学和设计工具,包括数据库设计方法、设计工具和设计理论的研究,数据模型和数据建模的研究,计算机辅助数据库设计方法及其软件系统的研究,数据库设计规范和标准的研究等。

数据库理论的研究主要集中于关系的规范化理论、关系数据理论等。计算机网络技术、人工智能技术、并行计算技术、分布式计算技术、多媒体技术等计算机领域中其他新兴技术的发展对数据库技术产生了重大影响。

1.2 数据库管理系统的功能和特点

数据库管理系统(DBMS)主要是实现对共享数据有效地组织、管理和存取。

DBMS的功能主要包括数据定义,数据库操作,数据库运行管理,数据组织、存储和管理,数据库的建立和维护,其他功能。

数据定义:DBMS 提供数据定义语言(Data Definition Language, DDL),用户可以对数据库的结构描述,包括外模式、模式和内模式定义;数据库的完整性定义;安全保密定义,如又令、级别和存取权限等。这些定义存储在数据字典中,是DBMS运行的基本依据。

数据库操作:DBMS向用户提供数据操纵语言(Data Manipulation Language,DML),实现对数据库中数据的基本操作,如检索、插入、修改和删除。DML分为两类:宿主型和自含型。所谓宿主型,是指将DML语句嵌入某种主语言(如C、Java、COBOL等)中使用;自含型是指可以单独使用DML语句,供用户交互使用。

数据库运行管理:数据库在运行期间多用户环境下的并发控制、安全性检查和存取控制、完整性检查和执行、 运行日志的组织管理、事务管理和自动恢复等是DBMS的重要组成部分。这些功能可以保证数据库系统的正常运行。

数据组织、存储和管理:DBMS 分类组织、存储和管理各种数据,包括数据字典、用户数据和存取路径等。要确定以何种文件结构和存取方式在存储级上组织这些数据,以提高存取效率。实现数据间的联系、数据组织和存储的基本目标是提高存储空间的利用率。

数据库的建立和维护:数据库的建立和维护包括数据库的初始建立、数据的转换、数据库的转储和恢复、数据库的重组和重构、性能监测和分析等。

其他功能:DBMS与网络中其他软件系统的通信功能,一个DBMS与另一个DBMS或文件系统的数据转换功能等。

DBMS 管理数据具有如下特点:


数据结构化且统一管理。数据库中的数据由DBMS统一管理。由于数据库系统采用复杂的数据模型表示数据结构,数据模型不仅描述数据本身的特点,还描述数据之间的联系。数据不再面向某个应用,而是面向整个应用系统。数据易维护、易扩展,数据冗余明显减少,真正实现了数据的共享。

有较高的数据独立性。数据的独立性是指数据与程序独立,将数据的定义从程序中分离出去,由DBMS 负责数据的存储,应用程序关心的只是数据的逻辑结构,无须了解数据在磁盘上的数据库中的存储形式,从而简化应用程序,大大减少应用程序编制的工作量。数据的独立性包括数据的物理独立性和数据的逻辑独立性。

数据控制功能。DBMS提供了数据控制功能,以适应共享数据的环境。数据控制功能包括对数据库中数据的安全性、完整性、并发和恢复的控制。

数据的安全性(security)是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。如划分不同的权限,使用户只能按权限规定对数据进行处理。

数据的完整性(integrality)是指数据库正确性和相容性,是防止合法用户使用数据库时向数据库加入不符合语义的数据。保证数据库中数据是正确的,避免非法的更新。

并发控制(concurency control )是指在多用户共享的系统中,许多用户可能同时对同一数据进行操作。DBMS 的并发控制子系统负责协调并发事务的执行,保证数据库的完整性不受破坏,避免用户得到不正确的数据。

故障恢复(recovery from failure)。数据库中的4类故障是事务内部故障、系统故障、介质故障及计算机病毒。故障恢复主要是指恢复数据库本身,即在故障引起数据库当前状态不一致后,将数据库恢复到某个正确状态或一致状态。

DBMS 有如下三个分类:


(1)关系数据库系统(Relation DataBase Systems, RDBS)。关系数据库系统是建立在关系数据库模型基础上的数据库,借助于集合代数等概念和方法来处理数据库中的数据。目前主流的关系数据库有Oracle、DB2、Sybase、Microsoft SQLServer、Microsoft Access、MySQL等。在关系模型中,实体以及实体间的联系都是用关系来表示的。


(2)面向对象的数据库系统(Object-Oriented DataBase System, OODBS)。面向对象的数 据库系统是支持以对象形式对数据建模的数据库管理系统,包括对对象的类、类属性的继承和子类的支持。面向对象数据库系统主要有两个特点: 一是面向对象数据模型能完整地描述现实世界的数据结构,能表达数据间的嵌套、递归联系;二是具有面向对象技术的封装性和继承性, 提高了软件的可重用性。


(3)对象关系数据库系统(Object-Oriented Relation DataBase System, ORDBS)。在传统的关系数据模型基础上提供元组、数组、集合等更为丰富的数据类型以及处理新的数据类型操作的能力,这样形成的数据模型被称 “对象关系数据模型” ,基于对象关系数据模型的DBS称内对象关系数据库系统。


1.3 数据库系统的体系结构

从最终用户的角度看,数据库系统体系结构分为集中式、分布式、客户端/服务器(C/S)和并行结构。


集中式数据库系统:数据是集中的,数据的管理也是集中的,数据库系统的所有功能,从形式的用户接又到DBMS核心都集中在DBMS所在的计算机上。

客户端/服务器(C/S)数据库系统:一个处理机 (客户端)的请求被送到另 一个处理机 (服务器)上执行,其主要特点是客户端与服务器CPU之间的职责明确,客户端主要负责数据表示服务,而服务器主要负责数据库服务。

采用C/S结构后,数据库系统功能分为前端和后端。前端主要包括图形用户界面、表格生成和报表处理等工具;后端负责存取结构、查询计算和优化、并发控制以及故障恢复等。前端与后端通过SQL或应用程序来接又。ODBC(开放式数据库互连)和JDBC(Java程序数据库连接)标准定义了应用程序和数据库服务器通信的方法,也即定义了应用程序接又,应用程序用它来打开与数据库的连接、发送查询和更新以及获取返回结果等。


数据库服务器一般可分为事务服务器和数据服务器:


事务服务器。事务服务器也称查询服务器。它提供一个接口,使得客户端可以发出执行一个动作的请求,服务器响应客户端请求,并将执行结果返回给客户端。用户端可以用SQL,也可以通过应用程序或使用远程过程调用机制来表达请求。 一个典型的事务服务器系统包括多个在共享内存中访问数据的进程,包括服务器进程、锁管理进程、写进程、监视进程和检查点进程。

数据服务器。数据服务器系统使得客户端可以与服务器交互,以文件或页面为单位对数据进行读取或更新。数据服务器与文件服务器相比提供更强的功能,所支持的数据单位可比文件还要小,如页、元组或对象;提供数据的索引机制和事务机制,使得客户端或进程发生故障时数据也不会处于不一致状态。

并行数据库系统:并行数据库系统是多个物理上连在一起的CPU,而分布式系统是多个地理上分开的CPU。并行体系结构的数据库类型分为共享内存式多处理器和无共享式并行体系结构。

共享内存式多处理器是指一台计算机上同时有多个活动,它们共享单个内存和一个公共磁盘接口。

无共享式并行体系结构是指一台计算机上同时有多个活动的CPU,并且它们都有自己的内存和磁盘。

分布式数据库系统:分布式 DBMS 包括物理上分布、逻辑上集中的分布式结构和物理上分布、逻辑上分布的分布式数据库结构两种。前者的指导思想是把单位的数据模式(称为全局数据模式)按数据来源和用途,合理地分布在系统的多个节点上,使大部分数据可以就地或就近存取。数据在物理上分布后,由系统统一管理,使用户不感到数据的分布。后者一般由两部分组成:一是本节点的数据模式;二是本节点共享的其他节点上有关的数据模式。节点间的数据共享由双方协商确定。这种数据库结构有利于数据库的集成、扩展和重新配置。

1.4 数据库系统的三级模式结构

  1. 视图层(view level)最高层次的抽象,描述整个数据库的某个部分。因为数据库系统的很多用户并不关心数据库中的所有信息,而只关心所需要的那部分数据。
  2. 逻辑层(logical level)是比物理层更高一层的抽象,描述数据库中存储什么数据以及这些数据间存在什么关系。
  3. 物理层(physical level)是最低层次的抽象,描述数据在存储器是如何存储的。物理层详细地描述复杂的底层结构。

数据库系统采用三级模式结构,这是数据库管理系统内部的系统结构。数据库有“型”和“值”的概念,“型” 是指对某一数据的结构和属性的说明,“值”是型的一个具体赋值。


外模式也称用户模式或子模式,是用户与数据库系统的接口,是用户用到的那部分数据的描述。它由若干个外部记录类型组成。用户使用数据操纵语言对数据库进行操作,实际上是对外模式的外部记录进行操作。

概念模式也称模式,是数据库中全部数据的逻辑结构和特征的描述,它由若干个概念记录类型组成,只涉及型的描述,不涉及具体的值。概念模式的一个具体值称为模式的一个实例, 同一个模式可以有很多实例。概念模式反映的是数据库的结构及其联系,所以是相对稳定的;而实例反映的是数据库某一时刻的状态,所以是相对变动的。

内模式也称存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。定义所有的内部记录类型、索引和文件的组织方式,以及数据控制方面的细节。

数据库系统在三级模式之间提供了两级映像:模式/内模式映像、外模式/模式映像。正因为这两级映像保证了数据库中的数据具有较高的逻辑独立性和物理独立性。


模式/ 内模式的映像:存在于概念级和内部级之间,实现了概念模式到内模式之间的相互转换。

外模式/模式的映像:存在于外部级和概念级之间,实现了外模式到概念模式之间的相互转换。

数据的独立性是指数据与程序独立,将数据的定义从程序中分离出去,由 DBMS 负责数据的存储,从而简化应用程序,大大减少应用程序编制的工作量,由二级映像功能来保证。


数据的物理独立性:是指当数据库的内模式发生改变时,数据的逻辑结构不变。由于应用程序处理的只是数据的逻辑结构,这样物理独立性可以保证,当数据的物理结构改变了,应用程序不用改变。但是,为了保证应用程序能够正确执行,需要修改概念模式/内模式之间的映像。

数据的逻辑独立性:是指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构发生变化后,用户程序也可以不修改。但是,为了保证应用程序能够正确执行,需要修改外模式/概念模式之间的映像。

2. 数据模型

模型就是对现实世界特征的模拟和抽象。数据模型是对现实世界数据特征的抽象。

最常用的数据模型分为概念数据模型和基本数据模型:

概念数据模型也称信息模型,是按用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象,强调其语义表达功能,易于用户理解,是用户和数据设计人员交流的语言,主要用于数据库设计。这类模型中最著名的是实体联系模型,简称E-R模型。

基本数据模型是按计算机系统的观点对数据建模,是现实世界数据特征的抽象,用于DBMS的实现。不同的数据模型具有不同的数据结构形式,目前最常用的数据结构模型有层次模型(hierarchical model)、网状模型(network model)、关系模型(relational Model)和面向对象数据模型(objectoriented model)。其中,层次模型和网状模型统称为非关系模型。

关系数据库系统是采用关系模型作内数据的组织方式,在关系模型中用二维表格结构表达实体集,以及实体集之间的联系,其最大特色是描述的一致性。关系模型是由若干个关系模式 组成的集合。一个关系模式相当于 一个记录型,对应于程序设计语言中类型定义的概念。关系 是一个实例,也是一张表,对应于程序设计语言中的变量的概念。给定变量的值随时间可能发 生变化;类似地,当关系被更新时,关系实例的内容也随时间发生了变化。


数据库结构的基础是数据模型,是用来描述数据的一组概念和定义。数据模型的三要素是数据结构、数据操作和数据的约束条件。


数据结构:是所研究的对象类型的集合,是对系统静态特性的描述。

数据操作:对数据库中各种对象 (型)的实例 (值)允许执行的操作的集合,包括操作及操作规则。如操作有检索、插入、删除和修改,操作规则有优先级别等。数据操作是对系 统动态特性的描述。

数据的约束条件:是一组完整性规则的集合。

数据库基础知识(下):https://developer.aliyun.com/article/1529291

相关实践学习
体验RDS通用云盘核心能力
本次实验任务是创建一个云数据库RDS MySQL(通用云盘),并通过云服务器ECS对RDS MySQL实例进行压测,体验IO加速和IO突发带来的性能提升;并通过DMS执行DDL,将数据归档到OSS,再结合云盘缩容,体验数据归档带来的成本优势。
相关文章
|
7月前
|
SQL 关系型数据库 MySQL
【MySQL】— —熟练掌握用SQL语句实现数据库和基本表的创建。熟练掌握MySQL的安装、客户端登录方法;熟练掌握MySQL的编码、数据类型等基础知识;掌握实体完整性的定义和维护方法、掌握参照完整性
【MySQL】— —熟练掌握用SQL语句实现数据库和基本表的创建。熟练掌握MySQL的安装、客户端登录方法;熟练掌握MySQL的编码、数据类型等基础知识;掌握实体完整性的定义和维护方法、掌握参照完整性
|
6月前
|
存储 SQL NoSQL
数据库技术全攻略:从基础知识到实践应用
一、引言 在信息化高速发展的今天,数据库技术已经成为企业运营、系统开发和数据分析等领域不可或缺的重要工具
|
6月前
|
存储 SQL 人工智能
数据库基础知识(下)
数据库基础知识
89 0
|
7月前
|
SQL Java 数据库连接
JAVA数据库的基础知识
JAVA数据库的基础知识
80 1
|
SQL NoSQL 关系型数据库
[MySQL]基础知识笔记(数据库与表操作)
MySQL基础知识(数据库的操作,表的操作(增删改查)等等)
|
NoSQL 关系型数据库 MySQL
数据库基础知识总结
数据库知识基础,这部分内容一定要理解记忆。虽然这部分内容只是理论知识,但是非常重要,这是后面学习 MySQL 数据库的基础。
184 0
|
关系型数据库 MySQL 测试技术
MySQL实战基础知识入门(1):登录数据库命令行
MySQL实战基础知识入门(1):登录数据库命令行
121 0
|
7月前
|
存储 关系型数据库 MySQL
MySQL入门:了解数据库基础知识
MySQL入门:了解数据库基础知识
94 0
|
7月前
|
SQL 关系型数据库 MySQL
MYSQL基础知识之【创建,删除,选择数据库】
MYSQL基础知识之【创建,删除,选择数据库】
83 0
|
存储 关系型数据库 MySQL
数据库基础知识以及MySQL简介
数据库基础知识以及MySQL简介
下一篇
DataWorks