数据库设计理论

简介:

数据库设计理论

一、           数据库设计的几个原则

一个好的数据库产品不等于就是一个好的应用系统,如果不能设计一个合理的数据库模型,不仅会增加客户端与服务器端的编程和维护难度,而且会影响系统实际运行的性能。因此,要想开发出一款理想的数据库产品应遵循以下设计准则:

(1)       命名规范化

不同的数据库产品对对象的命名有不同的要求。数据库中的各种对象的命名以及后台程序的代码编写应采用大小写敏感的字母形式,各种对象命名长度不要超过30个字符,这样便于应用系统适应不同的数据库。

(2)       慎用游标(Cursor)

对多表和大表定义的游标(大的数据集合)而言,使用游标逐行遍历数据很容易使程序进入漫长的等待甚至死机,因此在使用游标时,可以考虑建立一个临时表,将符合条件的数据行转入临时表中,再对临时表定义游标进行操作,这时性能会得到明显提高。

(3)       索引(Index)的使用

索引一般用于快速访问表中的数据。大型数据库有两种索引,即簇索引和非簇索引。添加任何一种索引均能提高按索引列查询的速度,但会降低插入、更新、删除操作的性能,尤其是当填充因子(Fill Factor)较大时。所以,如果要对索引较多的表进行频繁的插入、更新、删除操作,建立表和索引时应该设置较小的填充因子,以便在各项数据页中留下较多的自由空间,减少页分割及重新重新组织的工作,这样才能够提高性能。

(4)       数据的一致性和完整性

为了保证数据库的一致性和完整性,设计人员往往会设计过多的表间关联,尽可能地降低数据的冗余。但是,表间关联是一种强制性措施,建立后,对父表和子表的插入、更新、删除操作均要占用系统的开销。此外,最好不要用Identify属性字段作为主键与子表关联。如果数据冗余低,数据的完整性容易得到保证,但增加了表间连接查询的操作,因此,为了提高系统的响应时间,合理的数据冗余也是必要的。

(5)       事务的使用

事务是必须一次性完成的一组操作。虽然这些操作是单个的操作,但数据库系统能够保证这组操作要么全部都完成,要么一点都不做。正是大型数据库的这一特性,使得数据的完整性得到了极大的保证。

(6)       数据库性能调整

在计算机硬件配置和网络设计确定的情况下,影响到应用系统性能的因素主要是数据库性能和客户端程序设计。大多数数据库设计员采用两步法进行数据库设计:首先进行逻辑设计,而后进行物理设计。数据库逻辑设计去除了所有冗余数据,提高了数据吞吐速度,保证了数据的完整性,清楚地表达数据元素之间的关系。而对于多表之间的关联查询(尤其是大数据表)时,其性能将会降低,同时也提高了客户端程序的编程难度,因此,物理设计需折中考虑,根据业务规则,确定关联表的数据量大小、数据项的访问频度,对此类数据表频繁的关联查询应适当提高数据冗余设计。

(7)       数据类型的选择

数据类型的合理选择对于数据库的性能和操作具有很大的影响。

?         Identify字段不要作为表的主键与其他表关联,这将会影响到该表的数据迁移。

?         Text和Image字段属指针型数据,主要用来存放二进制大型对象(BLOB)。这类数据的操作相比其他数据类型较慢,因此要避开使用。

?         日期型字段的优点是有众多的日期函数支持,因此,在日期的大小比较、加减操作上非常简单。但是,按照日期作为条件的查询操作也要用函数,相比其他数据类型在速度上就慢许多。这是因为用函数作为查询的条件时,服务器无法用先进的性能策略来优化查询,只能进行表扫描遍历每行。

二、           数据库设计的基本步骤

对于数据库设计来说,比较统一的看法是分为5个步骤:需求分析,概念结构设计,逻辑结构设计,物理设计,数据实施和维护。

1.     需求分析

要设计一个良好的数据库系统,首先要明确应用环境对系统的要求。因此,对应用环境的需求收集和分析就是数据库设计的第一步。需求阶段收集到的基础数据和一组数据流程图是进行下一步概念设计的基础。需求分析包括以下几个方面:

(1)       收集资料

收集资料是数据库设计人员和用户共同完成的任务。强调各级用户的参与是数据库应用系统设计的特点之一。

(2)       分析整理

在大量资料收集完成以后,就要对资料进行分析和整理。分析的过程是对所收集到的数据进行抽象的过程。

(3)       数据流程图

在系统分析中通常采用数据流程图(Data Flow Diagram)来描述系统的数据流向和对数据的处理功能。

(4)       数据字典(Data Dictionary)

除了一套数据流程图外,还要从原始的数据资料中分析整理出下述数据信息:数据元素的名称、同义词、性质、取值范围、提供者、使用者、控制权限、保密要求、使用频率、数据量、数据之间联系的语义说明、各个部门对数据的要求以及数据处理要求。

(5)       用户确认

数据流程图集和数据字典的内容必须返回给用户,并且用非专业术语与用户交流。

需求分析阶段的成果要形成文档资料,至少包括各项业务的数据流程图及有关说明和对各类数据描述的集合,即数据字典。

2.     概念结构设计

将需求分析得到的用户需求抽象为信息结构设计及概念模型的过程就是概念结构设计,它是整个数据库设计的关键。概念建模的过程包括定义实体集、定义联系和定义属性。当这3种成分确定之后,就可以用E-R方法来进行数据库的概念设计。在设计完全局的E-R图之后,要尽量消除冗余。

3.     逻辑结构设计

数据库逻辑设计的任务是将概念结构设计阶段设计好的基本E-R图,转换成特定DBMS所支持的数据模型的过程。这样开始进入“实现设计”,需要考虑具体DBMS的性能,具体的数据模型特点。逻辑设计可分为E-R图向关系模型的转化、数据模型的优化和设计用户子模式3个过程。

4.     物理设计

对于给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,称为数据库物理设计。数据库的物理设计通常分为两步:确定数据库的物理结构,在关系数据库中主要指存取方法与存储结构:对物理结构进行评价,评价的重点的时间和空间效率。

5.     数据库的实施和维护

数据库的实施和维护过程可分数据的载入和应用程序的调试、数据库的试运行和数据库的维护与运行。

本文转自博客园执着的笨蛋的博客,原文链接:数据库设计理论,如需转载请自行联系原博主。

目录
相关文章
|
5天前
|
数据库
数据库设计过程
数据库设计过程
20 0
|
5天前
|
数据库
7.4关系数据库设计基础知识
7.4关系数据库设计基础知识
|
9月前
|
数据可视化 安全 数据建模
数据库设计理论与实践
数据库设计理论与实践
48 0
|
7月前
|
存储 NoSQL 数据库
数据库设计的重要阶段阐述
数据库设计的重要阶段阐述
82 0
|
SQL 搜索推荐 Java
MyBatis项目中使用GROUP BY分组查询出现异常的原因分析和修复记录
本篇文章记录了在MyBatis项目中使用SQL中的分组查询GROUP BY语句,查询多个字段时数据查询报错的问题。分析了导致GROUP BY查询语句报错的原因并提出解决这样问题的方法。通过对这样问题的解决记录,可以帮助大家在使用MyBatis中的GROUP BY查询时避免出现一些问题。
3095 0
MyBatis项目中使用GROUP BY分组查询出现异常的原因分析和修复记录
|
12月前
|
存储 SQL 数据管理
【数据库原理 • 四】数据库设计和规范化理论
数据库技术是计算机科学技术中发展最快,应用最广的技术之一,它是专门研究如何科学的组织和存储数据,如何高效地获取和处理数据的技术。它已成为各行各业存储数据、管理信息、共享资源和决策支持的最先进,最常用的技术。 当前互联网+与大数据,一切都建立在数据库之上,以数据说话,首先需要聚集数据、分析数据和管理数据,数据库技术已成为各种计算机系统的核心技术。数据库相关知识也已成为每个人必须掌握的知识。
381 0
|
存储 SQL 缓存
【数据库设计与实现】第三章:数据后像与前滚
数据后像与前滚设计原则事务的持久性要求事务提交时本次事务的修改必须完成持久化工作,而事务修改的block或page在大部分场景下并不是连续的,在持久化设备上表现为大量的随机IO。通过记录后像,可以将随机IO转换为对持久化设备更为有利的顺序IO,并将dirty block或dirty page(指被修改过但尚未完成持久化的block或page)的多次修改合并,节约block或page的持久化次数。后
【数据库设计与实现】第三章:数据后像与前滚
|
存储 数据库
数据库系统概论第七章(数据库设计)知识点总结(2)—— 需求分析
安全性是指用户需要如何保护数据不被未授权的用户破坏;完整性是指用户需要如何检查和控制不合语义的、不正确的数据,防止它们进入数据库
207 0
数据库系统概论第七章(数据库设计)知识点总结(2)—— 需求分析