本文目录
什么是数据库的规范化设计
规范化理论是将一个不合理的关系模式如何转化为合理的关系模式理论,规范化理论是围绕范式而建立的。规范化理论认为,一个关系型数据库中所有的关系,都应满足一定的规范。规范化理论把关系应满足的规范要求分为几级,满足最低要求的一级叫做第一范式(1NF),在第一范式的基础上提出了第二范式(2NF),在第二范式的基础上又提出了第三范式(3NF),以后又提出了BCNF范式,4NF,5NF。范式的等级越高,应满足的约束条件也越严格。规范的每一级别都依赖于它的前一级别,例如若一个关系模式满足2NF,则一定满足1NF。
对以上最简单的理解就是:数据库里面的数据存在多种异常、冗余或其他有矛盾的地方,而规范化就是消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。为了消除这些问题于是就有了以上几个范式。
什么是数据库的规范化设计
数据库规范化的意义
【TechTarget中国原创】数据库规范化是由Edgar Frank Codd提出的,他是IBM公司的一位计算机科学家,他在自己的论文《20世纪70年代大型共享数据银行数据关系模型》中首次提出这种说法。数据库规范化是一个过程,这个过程中需要对现存表结构进行修改,把表转化使遵循一系列先进的范式。
它着重于消除开发人员和他们项目的“电子表格综合症”。电子表格综合症是指开发人员倾向于在尽可能少的表中挤下尽可能多的信息。
早些时候,由于受电子表格的概念以及在电子表格中管理数据思路的影响,开发人员们一直采用与涉及电子表格相同的思路设计MySQL数据库。现在,再用这种方法设计MySQL数据库被认为是不明智的做法,因为这种电子表格综合症设计的表在每次数据库有很小的改变时,都要持续不断地进行重新设计。
在MySQL中实现数据库规范化的好处
通过智能数据分类,降低存储空间使用量是对MySQL实现数据库规范化的众多好处之一。它帮助实现了更好,更快,更强的搜索功能,因为它与早期基于混合实体的搜索方式相比,需要扫描更少的实体。通过数据库规范化,数据完整性也得以改善,因为它把所有数据分成单独的实体,并用关联数据在实体间建立强连接。
Mike Hillyer是之前MySQL AB的一位技术作家,他解释说:“数据库规范化的目标是确保每个表中所有非键列都直接依赖于主键:整个都是键,除了键没有其它。有了这个目标,随之而来还有一些好处,我们降低了冗余,减少了异常,提高了效率。”
数据规范化很容易做到
下面的例子将说明数据库规范化如何帮助实现MySQL中的良好设计。下面的表展示了需要在数据库中捕获的数据。
Chad Russell is a programmer and system administrator who owns his own internet hosting company. Jon Stephens is a member of the MySQL AB documentation team.
在上面展示的例子中,如果任意一个条件作为识别主键的话,会有大量的存储空间被浪费掉。因此,数据库规范化是必不可少的。这是一个循序渐进的过程,不能随意进行。下面的步骤可以帮你在MySQL中实现数据库规范化。
什么是数据库的规范化设计
规范化理论把关系应满足的规范要求分为几级,满足最低要求的一级叫做第一范式(1NF),在第一范式的基础上提出了第二范式(2NF),在第二范式的基础上又提出了第三范式(3NF),以后又提出了BCNF范式,4NF,5NF。范式的等级越高,应满足的约束集条件也越严格。
第一范式(1NF)
在关系模式R中中,如果每个属性值都是不可再分的原子属性,则称R是第一范式的关系[2]。例如:关系R(职工号,姓名,电话号码)中一个人可能有一个办公室电话和一个住宅电话号码,规范成为1NF的方法一般是将电话号码分为单位电话和住宅电话两个属性,即 R(职工号,姓名,办公电话,住宅电话)。1NF是关系模式的最低要求。
第二范式(2NF)
如果关系模式R是1NF且其中的所有非主属性都完全函数依赖于关键字,则称关系R 是属于第二范式的[2]。例:选课关系 SC(SNO,CNO,GRADE,CREDIT)其中SNO为学号, CNO为课程号,GRADEGE 为成绩,CREDIT 为学分。 由以上条件,关键字为组合关键字(SNO,CNO)。在应用中使用以上关系模式有以下问题: (1)数据冗余,假设同一门课由40个学生选修,学分就重复40次;(2)更新复杂,若调整了某课程的学分,相应元组的CREDIT值都要更新,有可能会出现同一门课学分不同;(3)插入异常,如计划开新课,由于没人选修,没有学号关键字,只能等有人选修才能把课程和学分存入;(4).删除异常,若学生已经结业,从当前数据库删除选修记录,而某些课程新生尚未选修,则此门课程及学分记录无法保存。以上问题产生的原因是非主属性CREDIT仅函数依赖于CNO,也就是CREDIT部分依赖组合关键字(SNO,CNO)而不是完全依赖。解决方法是将以上关系分解成两个关系模式 SC(SNO,CNO,GRADE)和C(CNO,CREDIT)。新关系包括两个关系模式,它们之间通过SC中的外键CNO相联系,需要时再进行自然联接,恢复原来的关系
第三范式(3NF)
如果关系模式R是2NF且其中的所有非主属性都不传递依赖于码,则称关系R是属于第三范式的[1]。例如关系模式S(SNO,SNAME,DNO,DNAME,LOCATION)中各属性分别代表学号、姓名、所在系、系名称、系地址。关键字SNO决定各个属性。由于是单个关键字,没有部分依赖的问题,肯定是2NF。但关系S肯定有大量的冗余,有关学生所在系的几个属性DNO,DNAME,LOCATION将重复存储,插入、删除和修改时也将产生类似以上例的情况。原因在于关系中存在传递依赖,即SNO -> DNO,DNO -> LOCATION, 因此关键字SNO对LOCATION函数决定是通过传递依赖SNO -> LOCATION 实现的。也就是说,SNO不直接决定非主属性LOCATION。解决方法是将该关系模式分解为两个关系S(SNO,SNAME,DNO)和D(DNO,DNAME,LOCATION),两个关系通过S中的外键DNO联系。
BC范式(BCNF)
如果关系模式R的所有属性(包括主属性和非主属性)都不传递依赖于R的任何候选关键字,那么称关系R是属于BCNF的。或者说关系模式R中,如果每个决定因素都包含关键字(而不是被关键字所包含),则R是BCNF[3]。 通常认为BCNF是修正的第三范式,有时也称为扩充的第三范式。
以上就是关于数据规范化是什么,什么是数据库的规范化设计的全部内容,以及数据规范化是什么的相关内容,希望能够帮到您。
版权声明:本文来自用户投稿,不代表【蒲公英】立场,本平台所发表的文章、图片属于原权利人所有,因客观原因,或会存在不当使用的情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系(邮箱:350149276@qq.com)我们将及时处理,共同维护良好的网络创作环境。