首页 第十一讲关系数据库规范化理论

第十一讲关系数据库规范化理论

举报
开通vip

第十一讲关系数据库规范化理论第十一讲关系数据库规范化理论Wednesday,July24,2019教学内容?如何使用关系模型设计关系数据库,针对一个现实问题,如何选择一个比较好的关系模式的集合,每个关系又应该由哪些属性组成。这属于数据库逻辑设计的问题。?本讲讲述关系数据库规范化理论,这是数据库逻辑设计的理论依据。?要求了解规范化理论的研究动机及其在数据库设计中的作用?掌握函数依赖的有关概念?第一范式、第二范式、第三范式的定义?重点掌握并能够灵活运用关系模式规范化的方法和关系模式分解的方法Wednesday,July24,2019教学重点及目标...

第十一讲关系数据库规范化理论
第十一讲关系数据库 规范 编程规范下载gsp规范下载钢格栅规范下载警徽规范下载建设厅规范下载 化理论Wednesday,July24,2019教学内容?如何使用关系模型 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 关系数据库,针对一个现实问题,如何选择一个比较好的关系模式的集合,每个关系又应该由哪些属性组成。这属于数据库逻辑设计的问题。?本讲讲述关系数据库规范化理论,这是数据库逻辑设计的理论依据。?要求了解规范化理论的研究动机及其在数据库设计中的作用?掌握函数依赖的有关概念?第一范式、第二范式、第三范式的定义?重点掌握并能够灵活运用关系模式规范化的方法和关系模式分解的方法Wednesday,July24,2019教学重点及目标?教学重点?函数依赖的理解?第一范式、第二范式、第三范式的应用?关系模式分解方法?教学目标?掌握函数依赖的概念及应用?掌握第一范式、第二范式、第三范式的概念及应用?了解BCNF范式?能灵活应用范式理论进行关系模式的分解Wednesday,July24,201911.1规范化问题的提出?关系数据库的规范化理论最早是由关系数据库的创始人E.F.Codd提出,后经许多专家学者深入的研究和发展,形成了一整套有关关系数据库设计的理论?系统运行效率、成败的决定因素?如何设计一个适合的关系数据库系统,关键是关系数据库模式的设计?一个好的关系数据库模式应该包括多少关系模式?每一个关系模式又应该包括哪些属性?如何将这些相互关联的关系模式组建一个适合关系模型?必须在关系数据库的规范化理论的指导下逐步完成。Wednesday,July24,201911.1.1关系数据库规范化理论的内容?主要包括三个方面?函数依赖?范式(NormalForm)?模式设计?函数依赖起着核心的作用,是模式分解和模式设计的基础,范式是模式分解的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 。?关系模式的存储异常问题?数据库的逻辑设计为什么要遵循一定的规范化理论??什么是好的关系模式??某些不好的关系模式可能导致哪些问题?Wednesday,July24,201911.1.2存储异常示例?教学管理数据库,关系模式SCDSCD(StudNo,StudName,StudSex,Deptment,DMasterNM,CourseID,StudScore)?其中,StudNo 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示学生学号,StudName表示学生姓名,StudSex表示学生性别,Deptment表示学生所在的系别,DMasterNM表示系主任姓名,CourseID表示课程号,StudScore表示成绩。?根据实际情况,这些数据有如下语义规定:?1.一个系有若干个学生,但一个学生只属于一个系;?2.一个系只有一名系主任,但一个系主任可以同时兼几个系的系主任;?3.一个学生可以选修多门功课,每门课程可有若干学生选修;?4.每个学生学习课程有一个成绩。Wednesday,July24,2019关系SCD示例数据StudNoStudNameStudSexDeptmentDMasterNMCourseIDStudScore99070401赵亦男计算机刘伟SJKJC019099070401赵亦男计算机刘伟GDSX018599070501钱尔男信息王平YY015799070501钱尔男信息王平DXYW028099070501钱尔男信息王平DXPLL027099070501钱尔男信息王平GDSX027099070502孙珊女信息王平SJKJC01099070502孙珊女信息王平GDSX017099070502孙珊女信息王平SJJG028599070601李思女自动化刘伟SJKJC0193Wednesday,July24,201911.1.3异常问题?(StudNo,CourseID)属性的组合能唯一标识一个元组,为主关系键?在进行数据库的操作时,会出现以下几方面的问题?1.数据冗余?系名、系主任姓名、学生姓名、性别重复,数据的冗余度很大,浪费了存储空间。?2.插入异常?新系没有招生,则系名和系主任的信息无法插入到数据库?在这个关系模式中(StudNo,CourseID)是主关系键,根据关系的实体完整性约束,主关系键的值不能为空,因没有学生,StudNo和CourseID均无值,不能进行插入操作。?当某个学生尚未选课,即CourseID未知,实体完整性约束主关系键的值不能部分为空,不能进行插入操作。Wednesday,July24,2019异常问题?3.删除异常?某系学生全部毕业而没有招生时,删除全部学生的记录则系名、系主任也随之删除,而这个系依然存在,在数据库中却无法找到该系的信息。?如果某个学生不再选修SJKJC01课程,本应该只删去SJKJC01,但SJKJC01是主关系键的一部分,为保证实体完整性,必须将整个元组一起删掉,这样,有关该学生的其它信息也随之丢失。?4.更新异常?学生改名,则该学生的所有记录都要逐一修改StudName?某系更换系主任,则属于该系的学生记录都要修改DMasterNM的内容,稍有不慎,就有可能漏改某些记录,这就会造成数据的不一致性,破坏了数据的完整性。Wednesday,July24,201911.1.4关系模式SCD分解?由于存在以上问题,SCD是一个不好的关系模式。?产生上述问题的原因,直观地说,是因为关系中“包罗万象”,内容太杂了。?把关系模式SCD分解为下面三个结构简单的关系模式?学生关系StudInfo(StudNo,StudName,StudSex,Deptment)?选课关系StudScoreInfo(StudNo,CourseID,StudScore)?系关系Deptmentinfo(Deptment,DMasterNM)Wednesday,July24,2019分解后的关系模式StudNoStudNameStudSexDeptment99070401赵亦男计算机99070501钱尔男信息99070502孙珊女信息99070601李思女自动化DeptmentDMasterNM计算机刘伟信息王平自动化刘伟StudNoCourseIDStudScore99070401SJKJC019099070401GDSX018599070501YY015799070501DXYW028099070501DXPLL025099070501GDSX027099070502SJKJC01099070502GDSX017099070502SJJG028599070601SJKJC0193StudInfoStudScoreInfoDeptmentInfoWednesday,July24,2019分解后的关系模式分析?在以上三个关系模式中,实现了信息的某种程度的分离?StudInfo中存储学生基本信息,与所选课程及系主任无关;?DeptmentInfo中存储系的有关信息,与学生无关;?StudScoreInfo中存储学生选课的信息,而与所学生及系的有关信息无关。?与SCD相比,分解为三个关系模式后,数据的冗余度明显降低。?当新插入一个系时,只要在关系DeptmentInfo中添加一条记录。?当某个学生尚未选课,只要在关系StudInfo中添加一条学生记录,而与选课关系无关,这就避免了插入异常。?当一个系的学生全部毕业时,只需在StudInfo中删除该系的全部学生记录,而关系DeptmentInfo中有关该系的信息仍然保留,从而不会引起删除异常。?由于数据冗余度的降低,数据没有重复存储,不会引起更新异常Wednesday,July24,201911.1.5结论?经过上述分析,分解后的关系模式是一个好的关系数据库模式。?结论:一个好的关系模式应该具备以下四个条件:?1.尽可能少的数据冗余?2.没有插入异常?3.没有删除异常?4.没有更新异常?注意:一个好的关系模式不是在任何情况下都是最优的?比如查询某个学生选修课程名及所在系的系主任时,要通过连接,而连接所需要的系统开销非常大,因此要以实际设计的目标出发进行设计Wednesday,July24,201911.2关系的规范化?关系的规范化:按照一定的规范设计关系模式,将结构复杂的关系分解成结构简单的关系,把不好的关系数据库模式转变为好的关系数据库模式。?规范化又可以根据不同的要求而分成若干级别?关系模式中的各属性是相互依赖、相互制约的,在设计关模式时,必须从语义上分析这些依赖关系,这样才构成了一个结构严谨的整体?数据库模式的好坏和关系中各属性间的依赖关系有关Wednesday,July24,201911.2.1函数依赖?数据依赖:关系模式中的各属性之间相互依赖、相互制约的联系?数据依赖一般分为函数依赖、多值依赖和连接依赖。?函数依赖是最重要的数据依赖,分为完全函数依赖、部分函数依赖和传递函数依赖三类,它们是规范化理论的依据和规范化程度的准则?函数依赖(FunctionalDependency)是关系模式中属性之间的一种逻辑依赖关系。Wednesday,July24,2019函数依赖?例:在关系模式SCD中,StudNo与StudName、StudSex、Deptment之间都有一种依赖关系。?由于一个StudNo只对应一个学生,而一个学生只能属于一个系,所以当StudNo的值确定之后,StudName,StudSex,Deptment的值也随之被唯一的确定了。?这类似于变量之间的单值函数关系。设单值函数Y=F(X),自变量X的值可以决定一个唯一的函数值Y?在这里,StudNo决定函数(StudName,StudSex,Deptment),或者说(StudName,StudSex,Deptment)函数依赖于StudNoWednesday,July24,201911.2.2函数依赖的定义?定义:设关系模式R(U,F),U是属性全集,F是U上的函数依赖集,X和Y是U的子集,如果对于R(U)的任意一个可能的关系r,对于X的每一个具体值,Y都有唯一的具体值与之对应,则称X决定函数Y,或Y函数依赖于X,记作X→Y。我们称X为决定因素,Y为依赖因素。当Y不函数依赖于X时,记作:XY。当X→Y且Y→X时,则记作:XY。?Wednesday,July24,2019函数依赖示例?对于关系模式SCDU={StudNo,StudName,StudSex,Deptment,DMasterNM,CourseID,StudScore}F={StudNo→StudName,StudNo→StudSex,StudNo→Deptment}?一个StudNo有多个StudScore的值与其对应,因此StudScore不能唯一地确定,即StudScore不能函数依赖于StudNo,所以有:StudNoStudScore。?但是StudScore可以被(StudNo,CourseID)唯一地确定。表示为:(StudNo,CourseID)→StudScoreWednesday,July24,201911.2.3函数依赖的基本性质?1.投影性?一组属性函数决定它的所有子集。?例:在关系SCD中,(StudNo,CourseID)→StudNo和(StudNo,CourseID)→CourseID。?2.扩张性?若X→Y且W→Z,则(X,W)→(Y,Z)。?例:StudNo→(StudName,StudSex),Deptment→DMasterNM,则有(StudNo,Deptmentement)→(StudName,StudSex,DMasterNM)?3.合并性?若X→Y且X→Z则必有X→(Y,Z)。?例:在关系SCD中,StudNo→(StudName,StudSex),StudNo→(Deptment,DMasterNM),则有StudNo→(StudName,StudSex,Deptment,DMasterNM)。?4.分解性?若X→(Y,Z),则X→Y且X→Z。很显然,分解性为合并性的逆过程。?由合并性和分解性,很容易得到以下事实:?X→A1,A2,…,An成立的充分必要条件是X→Ai(i=1,2,…,n)成立。Wednesday,July24,201911.2.4完全函数依赖与部分函数依赖?定义:设关系模式R(U),U是属性全集,X和Y是U的子集,如果X→Y,并且对于X的任何一个真子集X′,都有X′Y,则称Y对X完全函数依赖(FullFunctionalDependency),记作XY。如果对X的某个真子集X′,有X′→Y,则称Y对部分函数依赖(PartialFunctionalDependency),记作XY。?例:在关系模式SCD中StudNoStudScore,且CourseIDStudScore,有:(StudNo,CourseID)StudScoreStudNo→StudSex,有:(StudNo,CourseID)StudSex???f???p???f???pWednesday,July24,2019部分函数依赖?只有当决定因素是组合属性时,讨论部分函数依赖才有意义?当决定因素是单属性时,只能是完全函数依赖?例:在关系模式S(StudNo,StudName,StudSex,Deptment),决定因素为单属性StudNo,有StudNo→(StudName,StudSex,Deptment),不存在部分函数依赖。Wednesday,July24,201911.2.5传递函数依赖?定义:设有关系模式R(U),U是属性全集,X,Y,Z是U的子集,若X→Y,但YX,而Y→Z(YX,ZY),则称Z对X传递函数依赖(TransitiveFunctionalDependency),记作:XZ。如果Y→X,则XY,这时称Z对X直接函数依赖,而不是传递函数依赖。?例:在关系模式SCD中,StudNo→Deptment,但DeptmentStudNo,而Deptment→DMasterNM,则有StudNoDMasterNM。当学生不重名,有StudNo→StudName,StudName→StudNo,StudNoStudName,StudNo→Deptment,这时Deptment对StudName是直接函数依赖,而不是传递函数依赖。?????t????t?Wednesday,July24,201911.3范式?规范化的基本思想是消除关系模式中的数据冗余,消除数据依赖中的不合适的部分,解决数据插入、删除时发生异常现象。?范式(NormalForm):关系数据库的规范化过程中为不同程度的规范化要求设立的不同标准。?范式的概念最早由E.F.Codd提出,从1971年起,Codd相继提出了关系的三级规范化形式,即第一范式(1NF)、第二范式(2NF)、第三范式(3NF)。?1974年,Codd和Boyce以共同提出了一个新的范式的概念,即Boyce-Codd范式,简称BC范式。?1976年Fagin提出了第四范式?每种范式都规定了一些限制约束条件。Wednesday,July24,2019各种范式之间的关系?5NF4NFBCNF3NF2NF1NF?????Wednesday,July24,201911.3.1第一范式?第一范式(FirstNormalForm)是最基本的规范形式,即关系中每个属性都是不可再分的简单项。?定义:如果关系模式R,其所有的属性均为简单属性,即每个属性都是不可再分的,则称R属于第一范式,简称1NF,记作R?1NF。?在非规范化的关系中去掉组合项就能化成规范化的关系,每个规范化的关系都属于1NF?一个关系模式仅仅属于第一范式是不适用的,关系模式SCD属于第一范式,但其具有大量的数据冗余,具有插入异常、删除异常、更新异常等弊端Wednesday,July24,2019关系模式SCD中的函数依赖关系?关系模式SCD的关系键是(StudNo,CourseID)的属性组合(StudNo,CourseID)StudScoreStudNo→StudName,(StudNo,CourseID)StudNameStudNo→StudSex,(StudNo,CourseID)StudSexStudNo→Deptment,(StudNo,CourseID)DeptmentStudNoDMasterNM,(StudNo,CourseID)DMasterNM???f???p???p???p???t???pWednesday,July24,2019函数依赖图SCD中的函数依赖关系StudNameDMasterNMStudNoStudNoCourseIDPPf?在SCD中,既存在完全函数依赖,又存在部分函数依赖和传递函数依赖。这种情况在数据库中是不允许的,由于关系中存在着复杂的函数依赖,导致数据操作中出现了种种弊端?克服这些弊端的方法是用投影运算将关系分解,去掉过于复杂的函数依赖关系,向更高一级的范式进行转换。Wednesday,July24,201911.3.2第二范式?定义:如果关系模式R?1NF,且每个非主属性都完全函数依赖于R的每个关系键,则称R属于第二范式(SecondNormalForm),简称2NF,记作R?2NF。?在关系模式SCD中,(StudNo,CourseID)为主属性,StudName,StudSex,Deptment,DMasterNM,StudScore均为非主属性,经分析,存在非主属性对关系键的部分函数依赖,所以SCD不属于2NF?由SCD分解的三个关系模式Studinfo,DeptmentInfo,StudscoreInfo,其中Studinfo的关系键为StudNo,DeptmentInfo的关系键为Deptment,都是单属性,不可能存在部分函数依赖。?对于SC,(StudNo,CourseID)StudScore。所以SCD分解后,消除了非主属性对关系键的部分函数依赖,S,D,SC均属于2NF。???fWednesday,July24,2019全码?关系模式TCS(T,C,S),一个教师可以讲授多门课程,一门课程可以为多个教师讲授,同样一个学生可以选听多门课程,一门课程可以为多个学生选听,?(T,C,S)三个属性的组合是关系键,T,C,S都是主属性,而无非主属性,所以也就不可能存在非主属性对关系键的部分函数依赖,TCS?2NF。?结论?1.从1NF关系中消除非主属性对关系键的部分函数依赖,则可得到2NF关系。?2.如果R的关系键为单属性,或R的全体属性均为主属性,则R?2NF。Wednesday,July24,20192NF规范化?2NF规范化是指把1NF关系模式通过投影分解转换成2NF关系模式的集合。?分解时遵循的基本 原则 组织架构调整原则组织架构设计原则组织架构设置原则财政预算编制原则问卷调查设计原则 就是“一事一地”,让一个关系只描述一个实体或者实体间的联系。如果多于一个实体或联系,则进行投影分解。Wednesday,July24,20192NF规范化示例?关系模式SCD(StudNo,StudName,StudSex,Deptment,DMasterNM,CourseID,StudScore)规范为2NF。?由StudNo→StudName,StudNo→StudSex,StudNo→Deptment,(StudNo,CourseID)StudScore?可以判断,关系SCD至少描述了两个实体?一个为学生实体,属性有StudNo、StudName、StudSex、Deptment、DMasterNM;?另一个是学生与课程的联系(选课),属性有StudNo、CourseID和StudScore。?根据分解的原则,可以将SCD分解成如下两个关系???fWednesday,July24,2019SD和StudScoreInfo关系StudNoStudNameStudSexDeptmentDMasterNM99070401赵亦男计算机刘伟99070501钱尔男信息王平99070502孙珊女信息王平99070601李思女自动化刘伟StudNoCourseIDStudScore99070401SJKJC019099070401GDSX018599070501YY015799070501DXYW028099070501DXPLL025099070501YY017099070502SJKJC01099070502GDSX017099070502SJJG028599070601SJKJC0193StudScoreInfoSDWednesday,July24,2019SD和StudScoreInfo关系?对于分解后的两个关系SD和Studscoreinfo,主键分别为StudNo和(StudNo,CourseID),非主属性对主键完全函数依赖。因此,SD?2NF,Studscoreinfo?2NF。StudNoCourseIDStudScoreStudNoStudNameStudSexDeptmentDMasterNMSD中的函数依赖关系StudScoreInfo中的函数依赖关系Wednesday,July24,20192NF结论?1NF的关系模式经过投影分解转换成2NF后,消除了一些数据冗余?分析SD和StudScoreInfo中的数据,存储的冗余度比关系模式SCD有了较大辐度的降低。?学生的姓名、性别不需要重复存储多次。?在一定程度上避免数据更新所造成的数据不一致性的问题?由于学生的基本信息与选课信息分开存储,则学生基本信息因没选课而不能插入的问题得到了解决,插入异常得到了部分改善?如果某个学生不再选修C1课程,在选课关系StudScoreInfo中删去该该学生选修C1的记录即可,而SD中有关该学生的信息不会受到影响,解决了部分删除异常问题?因此关系模式SD和SC在性能上比SCD有了显著提高。Wednesday,July24,20192NF的缺点?2NF的关系模式解决了1NF中存在的一些问题,但仍然存在着一些问题:?1.数据冗余。每个系名和系主任的名字存储的次数等于该系的学生人数。?2.插入异常。当一个新系没有招生时,有关该系的信息无法插入。?3.删除异常。某系学生全部毕业而没有招生时,删除全部学生的记录也随之删除了该系的有关信息。?4.更新异常。更换系主任时,仍需改动较多的学生记录。Wednesday,July24,20192NF存在问题的原因?存在这些问题是由于在SCD中存在着非主属性对主键的传递依赖?分析SCD中的函数依赖关系,StudNo→StudName,StudNo→StudSex,StudNo→Deptment,Deptment→DMasterNM,StudNoDMasterNM,非主属性DMasterNM对主键StudNo传递依赖。?对关系模式SCD还需进一步简化,消除这种传递依赖,得到3NF???tWednesday,July24,201911.3.3第三范式?定义:如果关系模式R?2NF,且每个非主属性都不传递依赖于R的每个关系键,则称R属于第三范式(ThirdNormalForm),简称3NF,记作R?3NF。?第三范式具有如下性质:?1.如果R?3NF,则R?2NF?2.如果R?2NF,则R不一定是3NF。?例:关系模式SCD分解而得到的SD和StudScoreInfo都为2NF,其中,Studscoreinfo?3NF,但在SD中存在着非主属性DMasterNM对主键StudNo传递依赖,SD3NF。对于SD,应该进一步进行分解,使其转换成3NF。?Wednesday,July24,20193NF规范化?3NF规范化是指把2NF关系模式通过投影分解转换成3NF关系模式的集合。?和2NF的规范化时遵循的原则相同,即“一事一地”,让一个关系只描述一个实体或者实体间的联系。Wednesday,July24,20193NF规范化示例?例:将SD(StudNo,StudName,StudSex,Deptment,DMasterNM)规范到3NF?分析SD的属性组成,可以判断,关系SD实际上描述了两个实体:?一个为学生实体,属性有StudNo,StudName,StudSex,Deptment?一个是系的实体,其属性Deptment和DMasterNM?根据分解的原则,将SD分解成如下两个关系?StudInfo(StudNo,StudName,StudSex,Deptment),描述学生实体;?DeptmentInfo(Deptment,DMasterNM),描述系的实体。Wednesday,July24,2019StudInfo和DeptmentInfo关系?对于分解后的两个关系StudInfo和DeptmentInfo,主键分别为StudNo和Deptment,不存在非主属性对主键的传递函数依赖StudNoStudNameStudSexDeptment99070401赵亦男计算机99070501钱尔男信息99070502孙珊女信息99070601李思女自动化DeptmentDMasterNM计算机刘伟信息王平自动化刘伟StudInfoDeptmentInfoWednesday,July24,2019Studinfo和DeptmentInfo的函数依赖?关系模式SD由2NF分解为3NF后,函数依赖关系变得更加简单,既没有非主属性对键的部分依赖,也没有非主属性对键的传递依赖,解决了2NF中存在的四个问题。DeptmentDMasterNMDeptmentinfo中的函数依赖关系图Studinfo中的函数依赖关系图StudNoStudNameStudSexDeptmentWednesday,July24,20193NF结论?1.数据冗余降低。系主任的名字存储的次数与该系的学生人数无关,只在关系D中存储一次。?2.不存在插入异常。当一个新系没有学生时,该系的信息可以直接插入到关系D中,而与学生关系S无关。?3.不存在删除异常。要删除某系的全部学生而仍然保留该系的有关信息时,可以只删除学生关系S中的相关学生记录,而不影响系关系D中的数据。?4.不存在更新异常。更换系主任时,只需修改关系D中一个相应元组的DMasterNM属性值,从而不会出现数据的不一致现象。?SCD规范到3NF后,所存在的异常现象已经全部消失。?3NF只限制了非主属性对键的依赖关系,而没有限制主属性对键的依赖关系。仍有可能存在数据冗余、插入异常、删除异常和修改异常。?对3NF进一步规范化,消除主属性对键的依赖关系,Boyce与Codd共同提出了一个新范式的定义,这就是Boyce-Codd范式,通常简称BCNF或BC范式。它弥补了3NF的不足。Wednesday,July24,201911.3.4BCNF范式?定义:如果关系模式R?1NF,且所有的函数依赖X→Y(YX),决定因素X都包含了R的一个候选键,则称R属于BC范式(Boyce-CoddNormalForm),记作R?BCNF。?BCNF具有如下性质:?1.满足BCNF的关系将消除任何属性(主属性或非主属性)对键的部分函数依赖和传递函数依赖,如果R?BCNF,则R?3NF。?2.如果R?3NF,则R不一定是BCNF。?Wednesday,July24,2019BCNF范式示例?设关系模式StudCourse(StudNo,StudName,CourseID,StudScore),其中StudNo代表学号,StudName代表学生姓名并假设没有重名,CourseID代表课程号,StudScore代表成绩。可以判定,StudCourse有两个候选键(StudNo,CourseID)和(StudName,CourseID),其函数依赖如下:StudNoStudName(StudNo,CourseID)→StudScore(StudName,CourseID)→StudScore。?唯一的非主属性StudScore对键不存在部分函数依赖,也不存在传递函数依赖,StudCourseinfo?3NF?Wednesday,July24,2019主属性对键的部分函数依赖存在的问题?因StudNoStudName,即决定因素StudNo或StudName不包含候选键,从另一个角度说,存在着主属性对键的部分函数依赖:(StudNo,CourseID)StudName,(StudName,CourseID)StudNo,所以StudCourse不是BCNF。?因存在主属性对键的部分函数依赖关系,造成了关系StudCourse中存在着较大的数据冗余,学生姓名的存储次数等于该生所选的课程数,从而会引起修改异常。?例:当更改某个学生的姓名时,则必须搜索出现该姓名的每个学生选课记录,并对其姓名逐一修改,容易造成数据的不一致问题?解决这一问题的办法是通过投影分解进一步提高StudCourse的范式等级,将StudCourse规范到BCNF。???p???p?Wednesday,July24,2019BCNF规范化?BCNF规范化是指把3NF关系模式通过投影分解转换成BCNF关系模式的集合。?例:将StudCourse(StudNo,StudName,CourseID,StudScore)规范到BCNF。?分析StudCourse数据冗余的原因是在这一个关系中存在两个实体,一个为学生实体,属性有StudNo、StudName;另一个是选课实体,属性有StudNo、CourseID和StudScore。?根据分解的原则,将StudCourse分解成如下两个关系:?StudInfo(StudNo,StudName),描述学生实体;?StudScoreInfo(StudNo,CourseID,StudScore),描述学生与课程的联系。?对于StudInfo,有两个候选键StudNo和StudName?对于StudScoreInfo,主键为(StudNo,CourseID)。?在这两个关系中,无论主属性还是非主属性都不存在对键的部分依赖和传递依赖,StudInfo?BCNF,StudScoreInfo?BCNF。Wednesday,July24,2019Studinfo和Studscoreinfo的函数依赖?关系StudCourse转换成BCNF后,数据冗余度明显降低。?学生的姓名只在关系S1中存储一次,学生要改名时,只需改动一条学生记录中的相应的StudName值,从而不会发生修改异常。StudNoCourseIDStudScoreStudNoStudNameStudInfo中的函数依赖关系StudScoreInfo中的函数依赖关系Wednesday,July24,2019BCNF范式示例?例:设关系模式TCS(T,C,S),T表示教师,C表示课程,S表示学生。?语义假设:每一位教师只讲授一门课程;每门课程由一个教师讲授;某一学生选定某门课程,就对应于一确定的教师。?根据语义假设,TCS的函数依赖是:?(S,C)→T,(S,T)→C,T→C。SCTSTCTCS中的函数依赖关系Wednesday,July24,2019BCNF范式示例?对于TCS,(S,C)和(S,T)都是候选键,两个候选键相交,有公共的属性S。TCS中不存在非主属性,也就不可能存在非主属性对键的部分依赖或传递依赖,所以TCS?3NFTCST1C1S1T1C1S2T2C1S3T2C1S4T3C2S2T4C2S2T4C3S2TCS一个关系实例Wednesday,July24,2019关系TCS存在的问题?1.数据冗余。虽然每个教师只开一门课,但每个选修该教师该该门课程的学生元组都要记录这一信息。?2.插入异常。当某门课程本学期不开,自然就没有学生选修。没有学生选修,因为主属性不能为空,教师上该门课程的信息就无法插入。同样原因,学生刚入校,尚未选课,有关信息也不能输入。?3.删除异常。如果选修某门课程的学生全部毕业,删除学生记录的同时,随之也删除了教师开设该门课程的信息。?4.更新异常。当某个教师开设的某门课程改名后,所有选修该教师该门课程的学生元组都要进行修改,如果漏改某个数据,则破坏了数据的完整性。Wednesday,July24,2019BCNF范式示例?分析出现上述问题的原因在于主属性部分依赖于键,(S,T)C,因此关系模式还继续分解,转换成更高一级的范式BCNF,以消除数据库操作中的异常现象。?将TCS分解为两个关系模式ST(S,T)和TC(T,C),消除函数依赖(S,T)C。其中ST的键为S,TC的键为T。ST?BCNF,TC?BCNF。STTCST中的函数依赖关系TC中的函数依赖关系Wednesday,July24,2019BCNF结论?关系模式TCS由规范到BCNF后,解决原来存在的四个异常问题?1.数据冗余降低。每个教师开设课程的信息只在TC关系中存储一次。?2.不存在插入异常。对于所开课程尚未有学生选修的教师信息可以直接存储在关系TC中,而对于尚未选修课程的学生可以存储在关系ST中。?3.不存在删除异常。如果选修某门课程的学生全部毕业,可以只删除关系ST中的相关学生记录,而不影响系关系TC中相应教师开设该门课程的信息。?4.不存在更新异常。当某个教师开设的某门课程改名后,只需修改关系TC中的一个相应元组即可,不会破坏数据的完整性。?如果一个关系数据库中所有关系模式都属于BCNF,那么在函数依赖的范畴内,已经实现了模式的彻底分解,消除了产生插入异常和删除异常的根源,而且数据冗余也减少到极小程度。Wednesday,July24,201911.3.5关系模式的规范化?规范化的基本原则:遵从概念单一化“一事一地”的原则,即一个关系只描述一个实体或者实体间的联系。?若多于一个实体,就把它“分离”出来。?所谓规范化,实质上是概念的单一化,即一个关系表示一个实体Wednesday,July24,2019关系模式规范化的步骤?规范化就是对原关系进行投影,消除决定属性不是候选键的任何函数依赖。具体可以分为以下几步:?1.对1NF关系进行投影,消除原关系中非主属性对键的部分函数依赖,将1NF关系转换成若干个2NF关系。?2.对2NF关系进行投影,消除原关系中非主属性对键的传递函数依赖,将2NF关系转换成若干个3NF关系。?3.对3NF关系进行投影,消除原关系中主属性对键的部分函数依赖和传递函数依赖,也就是说使决定因素都包含一个候选键。得到一组BCNF关系。Wednesday,July24,2019关系模式规范化过程1NF2NF3NFBCNF消除决定属性不是候选键的非平凡的函数依赖消除非主属性对键的部分函数依赖消除非主属性对键的传递函数依赖消除主属性对键的部分和传递函数依赖消除原关系可再分的属性
本文档为【第十一讲关系数据库规范化理论】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_179289
暂无简介~
格式:ppt
大小:1MB
软件:PowerPoint
页数:0
分类:
上传时间:2019-07-18
浏览量:0