1.了解数据库的基本概念和发展史、数据库系统的特点、数据库系统的组成。
数据库的4个基本概念:
数据Data:数据库中存储的基本对象,描述事物的符号记录称为数据,数据的含义称为数据的语义,数据与其语义是不可分的。
数据库Data Base,DB:数据库是长期储存在计算机内、有组织的、可共享的大量数据集合。数据库中的数据按一定的数据规模组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,可为各种用户共享。
数据库管理系统DBMS:是计算机的基础软件,位于用户与操作系统之间的一层数据管理软件,其目的是提供一个可以方便、有效存取数据库信息的环境。具有数据定义(DDL定义数据库中的数据对象),数据组织、存储和管理,数据操纵(DML增删查改),数据库的事务管理和运行管理(数据安全性保护、数据完整性检查)、数据库的建立和维护(数据批量装载、数据库转储、截止故障恢复、数据库的重组织)等功能。常见的管理系统有:ORACLE、IBM DB 2、SYBASE、Microsoft SQL Server、MySQL、Microsoft Access。
数据库系统DBS;由数据库、数据库管理系统及其应用开发工具、应用程序和数据库管理员(DBA协调用户和开发人员的工作、参与数据库设计、创建用户和授权、保证数据库的正常运行、维护工作)组成的存储、管理、处理和维护数据的系统。
发展史:
人工管理阶段(40年代中-50年代中):
数据管理者:用户(程序员);
数据面向的对象:某一应用程序;
数据共享程度:无共享、冗余度极大;
数据独立性:不独立,完全依赖程序;
数据结构化:无结构;
数据控制能力:应用程序自己控制。
文件系统阶段(50年代末-60年代中):
数据管理者:文件系统;
数据面向的对象:某一应用;
数据共享程度:共享性差、冗余程度大;
数据独立性:独立性差,数据逻辑结构改变必修修改应用程序;
数据结构化:数据内有结构,整体无结构;
数据控制能力:应用程序自己控制。
数据库阶段(60年代末-现在):
数据管理者:数据库管理系统DBMS;
数据面向的对象:现实世界;
数据共享程度:共享性高;
数据独立性:高度的物理独立性和一定的逻辑独立性;
数据结构化:整体结构化,用数据模型描述;
数据控制能力:由数据库管理系统DBMS提供数据安全性、完整性、并发控制和恢复能力。
数据库系统的特点:
1.数据整体结构化(这是数据库系统与文件系统的本质区别);
2.数据的共享性高、冗余度低且易扩充;
3.数据独立性高:
物理独立性:用户的应用程序与数据库中数据的物理存储是相互独立的;
逻辑独立性:用户的应用程序与数据库的逻辑结构是相互独立的。
4.数据由数据库管理系统统一管理和控制:
数据的安全性保护;
数据的完整性检查;
并发控制;
数据库恢复。
数据库系统的组成:
数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统。
硬件平台及数据库、软件、人员。
2.掌握关系数据模型的特点,了解数据系统体系结构。
关系模型:
关系relation:一个关系对应一张表;
元组tuple:表中的一行就是一个元组;
属性attribute:表中的一列就是一个属性,给每个属性取个名字就是属性名;
码key:码键,可以确定某一个元组;
域domain:一组具有相同数据类型值的集合,属性的取值范围来自某个域;
分量:元组中的一个属性值;
关系模式:对关系的描述;
优点:建立在严格的数学概念基础上,概念单一,存取路径对用户透明,数据具有更高的独立性,更好的安全保密性,简化了程序员的工作。
缺点:查询效率比层次模型低。
3.E-R图:何谓E-R图,E-R图的作用,能够根据题目描述,规范绘制出E-R图,并将E-R图转换为关系模式。
E-R图:
实体型:用矩形表示,矩形框内写实体名;
属性:用椭圆表示,用直线将其与对应实体连接起来;
联系:用菱形表示,菱形框内写联系名,用直线将有关实体连接起来,同时在直线上写明对应类型(1对1,1对多,多对多)。联系本身也是一种实体型,也可以有属性。
4.数据模型:数据模型的组成要素、概念模型、最常用的数据模型、关系模型;
数据模型是对现实世界数据特征的抽象,是数据库系统的核心和基础。
数据模型分类:
概念模型(信息模型):按用户观点对数据和信息建模,用于数据库设计;
实体entity:客观存在并可相互区别的事物;
属性attribute:实体具有的某一特性;
码key:唯一标识实体的属性集;
实体型entity type:用实体名及其属性名集合来抽象和刻画的同类实体;
实体集entity set:同一类型实体的集合;
联系relationship:事物内部及事物间的联系,一对一、一对多、多对多;
表示方法:实体-联系方法,E-R方法也叫E-R模型。
逻辑模型和物理模型:
逻辑模型:按计算机系统的观点对数据建模,用于数据库管理系统的实现;
物理模型:对数据最底层的抽象,描述数据组在系统内部的表示方式和存取方法,或在磁盘、磁带上的存储方式和存取方法,是面向计算机系统的。
首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界。
现实世界到概念模型 由数据库设计人员完成;
概念模型到逻辑模型 由数据库设计人员或数据库设计工具协助设计人员完成;
逻辑模型到屋里模型 由数据库管理系统完成。
数据模型组成要素:
1.数据结构(静态特性):描述数据库的组成对象以及对象之间的联系;
2.数据操作(动态特性):对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则;
3.数据的完整条件约束:一组完整性规则。
常用的数据模型:
层次模型:
优点:数据结构比较简单清晰,查询效率高,提供了良好的完整性支持。
缺点:现实世界中有很多联系是非层次性的,限制较多,查询子女节点必须通过双亲节点,结构严密导致命令趋于程序化。
网状模型:
优点:能更为直接的描述现实世界,具有良好的性能,存取效率较高。
缺点:结构比较复杂,不容易掌握,需要用户了解系统结构的细节。
关系模型;
面向对象数据模型;
对象关系数据模型;
半结构化数据模型;