🌍数据模型:对现实世界的抽象
🪐1 两类数据模型
1.两类数据模型:概念模型+逻辑模型和物理模型
🪐2 概念模型
概念模型:表示方法:实体-联系方法(E-R方法,用E-R图)
现实世界->概念模型基本知识
- 实体:客观存在且可相互区分的事物 ------对应概念模型的记录
如:人、事、物...- 属性:实体的某一特征 ------对应概念模型的字段(数据项)
如:学生姓名、学号...- 码(key):唯一标识属性集
如:学号- 实体型:实体名+属性名集合
如:学生(学号,姓名,性别...)- 实体集:同类型实体集合
如:全体学生- 联系:实体内部联系+实体之间联系,可一对一、一对多、多对多
🪐3 数据模型
1 组成要素:
- 数据结构:DB对象与对象之间的联系
- 数据操作:增删改查
- 数据的完整性约束:一组完整性规则
2 常用数据模型:
- 层次模型
- 网状模型
- 关系模型
- 待续..
注:层次模型与网状模型统称格式化模型
🌕3.1 层次模型
层次模型:一根一双亲 关系:一对多
定义:
- 有且只有根结点没有双亲结点
- 根以外的其它结点有且只有一个双亲结点
示例:
数据操纵:增删改查
层次模型的完整性约束条件:
- 无相应的双亲结点值就不能插入子女结点值
- 如果删除双亲结点值,则相应的子女结点值也被同时删除
- 更新操作时,应更新所有相应记录,以保证数据的一致性
优缺点
优点:
- 层次模型的数据结构比较简单清晰
- 查询效率高,性能优于关系模型
缺点:
- 结点之间的多对多联系表示不自然
- 对插入和删除操作的限制多,应用程序的编写比较复杂
- 查询子女结点必须通过双亲结点层次命令趋于程序化
🌕3.2 网状模型
网状模型:多根多双亲 关系:多对多
定义:
- 允许一个以上的结点无双亲
- 一个结点可以有多于一个的双亲
示例:
数据操纵:增删改查
层次模型的完整性约束条件:码
优缺点
优点:
- 能够更为直接地描述现实世界,如一个结点可以有多个双亲
- 具有良好的性能,存取效率较高
缺点:
- 结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
- DDL、DMIL语言复杂,用户不容易使用
- 记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节
🌕3.3 关系模型
定义:二维表【规范表】,一般表示示例: 学生(学号,姓名,性别...)
示例:
术语:
- 关系:表
- 关系名:表名
- 元组:行
- 属性:列
- 码:唯一标识行,如:学号
- 域:相同数据类型值的集合,如性别的域是(男,女)
- 分量:元组中的一个属性值,如姓名中的王小明
- 关系模式:表头
- 非规范表:表中含表
数据操纵【操作对象和操作结果都是关系】:增删改查
层次模型的完整性约束条件:
- 实体完整性
- 参照完整性
- 用户定义的完整性
优缺点
优点:
- 建立在严格的数学概念的基础上概念单一
- 实体和各类联系都用关系来表示对数据的检索结果也是关系,关系模型的存取路径对用户透明
- 具有更高的数据独立性,更好的安全保密性简化了程序员的工作和数据库开发建立的工作
缺点:
- 存取路径对用户透明,查询效率往往不如格式化数据模型
- 为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度
📝总结
数据库SQL Server领域就像一片未被勘探的信息大海,引领你勇敢踏入数据科学的神秘领域。这是一场独特的学习冒险,从基本概念到算法实现,逐步揭示更深层次的模式分析、匹配算法和智能模式识别的奥秘。