本文颠覆数据库设计中对数据库范式“难理解”“难接受”“难运用”的看法,将用最通俗易懂的语言描述高深的技术问题,请看过本文的同志们发表下评论,如仍有意见和建议请直言不误:
数据规范化的主要目的是消除冗余,那什么叫冗余呢?比如一个1MB文件,在1000个目录里需要引用这个文件,如果拷贝1000次,就需要1000MB的空间存放这个文件及其复制品,这就造成了空间的浪费。但如果在引用的地方建立快捷方式,则避免了冗余,而且至少存在两个好处:
1. 只需1MB磁盘空间存储这个文件;
2. 更新一个文件,就能同步更新所有引用这个文件的内容;
就好比:手机说话不开扬声器前提下,只有一个人能看到,但广播,则一群人能听到,这相比将一件事告诉10个人,说上10遍要轻松多。
以上解释的文字有点多,只是先做个铺垫,便于以下精炼通俗语言的理解!!!!
【依赖】 --- 解释:比如b依赖a,即如果a没有了,b就没有存在的意义。
【主键或候选键】 -- 作用是确定表数据的唯一性。具体概念这里不做细讲。
第一范式 无重复的列 --!!!!! 注意是列不是行 !!!!!
情况1: 不能有重复的属性列
关系 table(col_1,col_2,col_2) -- 存在两列重复,造成数据冗余,可以删除一列,注意,有时列名不一定一样,但内容完全一样,也是冗余,不满足第一范式。
情况2:同一个属性里不能有多个值,必须是单值;
这个很好解释,即为什么表要设计成多个字段,而不是仅设计成1个字段,把所有内容都写进去?!自己领悟吧 :)
第二范式 完全依赖于主键(消除非主属性对主码的部分函数依赖)
关系table(col_1,col_2,col_3) 如果主键是(col_1,col_2) ,col_3仅依赖于col_2,属部分依赖,则不满足第二范式
--注意:只有出现复合候选码时才可能存在部分函数依赖。
第三范式 不依赖其他非主属性(消除传递依赖)
关系table(col_1,col_2,col_3,col_4) 如果主键是(col_1,col_2),col_3依赖(col_1,col_2) 则满足第二范式,但如果col_4依赖于col_3,则不满足第三范式。
到此应该彻底明白了吧,以下这句话只写给看到这里的同志们看:
如果有难以理解和消化的数据库概念,可以给我留言,我将根据具体情况在下一篇章进行通俗解释。