关闭

关闭

封号提示

内容

首页 数据库复习总结.doc

数据库复习总结.doc

数据库复习总结.doc

上传者: wuhongliang09 2011-05-04 评分 3 0 25 3 115 暂无简介 简介 举报

简介:本文档为《数据库复习总结doc》,可适用于考试题库领域,主题内容包含第一章数据库系统概论第一章数据库系统概论1.试述数据、数据库、数据库系统、数据库管理系统的概念。  数据:描述事物的符号记录称为数据。数据的种类有文符等。

第一章数据库系统概论第一章数据库系统概论1.试述数据、数据库、数据库系统、数据库管理系统的概念。  数据:描述事物的符号记录称为数据。数据的种类有文字、图形、图象、声音、正文等等。数据与其语义是不可分的。 数据库:数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存具有较小的冗余度、较高的数据独立性和易扩展性并可为各种用户共享。  数据库系统:数据库系统(DBS)是指在计算机系统中引入数据库后的系统构成。数据库系统由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。数据库管理系统:数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。用于科学地组织和存储数据、高效地获取和维护数据。DBMS主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。.什么是数据独立性?数据独立性又分为哪两个层次?为什么需要数据独立性?数据独立性是用来描述数据与应用程序之间的依赖程度包括数据的物理独立性和数据的逻辑独立性依赖程度越低则独立性越高物理独立性是指用户的应用程序与存储在磁盘上的数据库的数据时相互独立的。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。作用:数据在磁盘上怎样存储由DBMS管理用户程序不需要了解应用程序要处理的只是数据的逻辑结构这样当数据的物理存储改变了应用程序不用改变。数据独立性是通过数据库管理系统的两层映像功能来实现什么是数据模型?数据模型的基本要素有哪些?为什么需要数据模型?数据模型是描述数据语义、数据与数据之间联系(数据结构)、数据操作以及一致性约束的概念和工具的集合 数据模型的基本要素:数据结构:是所研究的对象类型的集合是对系统的静态特性的描述。 数据操作:是指对数据库中各种对象(型)的实例(值)允许进行的操作的集合包括操作及有关的操作规则是对系统动态特性的描述。数据的约束条件:是完整性规则的集合完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则用以限定符合数据模型的数据库状态以及状态的变化以保证数据的正确、有效、相容。作用:一般地讲数据模型是严格定义的概念的集合。这些概念精确地描述系统的静态特性、动态特性和完整性约束条件。为什么数据模型要分为概念模型逻辑模型和物理模型三类?试分别解释概念模型、逻辑模型和物理模型为什么:数据模型应满足方面的要求:一是能比较真实的模拟现实世界二是容易被人所理解三是便于在计算机上实现。一种数据模型要很好地同时满足这个方面的要求是很困难的因此在数据库管理系统中这对不同的使用对象和应用目的采用不同的数据模型。概念模型:指概念层次的数据模型也称为信息模型它按用户的观点或认识对现实世界的数据和信息进行建模主要用于数据库设计。常用的概念模型有实体联系模型(ER模型)和面向对象OO模型逻辑模型用来描述数据库数据的整体逻辑结构。传统的逻辑数据模型有层次模型、网状模型和关系模型非传统的逻辑数据模型有面向对象模型、XML模型等物理模型用来描述数据的物理存储结构和存取方法关系模型中的主要概念有哪些试分别解释之。关系模型由一组关系组成每个关系的数据结构是一张规范化的二维表。关系模型中的常用术语有:关系、元组、属性、码、域、分量和关系模式等。关系模型要求关系必须是规范化的即关系的每一个分量必须是一个不可分的数据项。关系数据模型的操作主要包括查询、插入删除和修改(更新数据)。关系数据模型的完整性约束条件包括实体完整性、参照完整性和用户自定义完整性试解释数据库的三级模式结构和两层映像。为什么数据库管理系统要提供数据库的三级模式结构和两层映像?数据库管理系统的数据抽象一般包括物理层抽象、逻辑层抽象和视图层抽象三个级别。对应于数据抽象的三个级别数据库管理系统一般也提供观察数据库的三个不同角度以方便不同的而用户使用数据库的需要这就是数据库的三级模式结构内模式、模式和外模式为了能够在系统内部实现三个抽象层次的数据之间的联系和转换数据库管理系统在数据库的三级模式之间提供了两层映像:外模式模式映像、模式内模式映像。正是这两层映像保证了数据库中的数据能够具有较高的逻辑独立性和物理独立性解释模式、外模式、内模式、DDL、DML等概念内模式也称存储模式对应于物理层数据抽象它是数据的物理结构和存储方式的描述是数据在数据库内部的表示方式模式也称为逻辑模式赌赢与逻辑层数据抽象是数据库中全体数据的逻辑结构和特征的描述是所有用户的公共数据视图外模式也成子模式或用户模式对应于视图层数据抽象它是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述是数据库用户的数据视图是与莫以具体运用有关的数据的逻辑表示数据库模式定义语言DDL(DataDefinitionLanguage)是用于描述数据库中要存储的现实世界实体的语言。一个数据库模式包含该数据库中所有实体的描述定义。这些定义包括结构定义、操作方法定义等。数据操纵语言DML命令使用户能够查询数据库以及操作已有数据库中的数据的计算机语言。具体是指是SELECT查询、UPDATE更新、INSERT插入、DELETE删除。第章关系模型与关系代数名词解释域:一组具有相同数据类型的值的集合笛卡尔积:两个分别为N目和m目的关系R和S的笛卡尔积是一个nm目元组的集合超码:属性集A能唯一标识关系r中的一个元组则称A为关系R的一个超码候选码:对于关系r中一个或多个属性的集合A若属性集A中的任意真子集都不能成为关系r的超码则、、、、、主码:在实体集中区分不同实体的候选码。外码:用于建立和加强两个表数据之间的关系而引用另一个关系的主码。关系模式:是型的概念它定义了元组集合的结构即定义了一个元组由哪些属性构成关系数据库:在一个给定的应用领域中所有实体以及实体之间的联系所对应的关系的集合空值:是所有可能的域的一个取值表明值未知或不存在。关系模式的完整性:实体完整性、参照完整性和用户自定义完整性。实体完整性:若属性A是关系r中的主码则A不能取空值参照完整性:若属性F是关系r的外码它与关系s的主码Ks相对应则对于关系r中的每一个元组在属性F上的取值要么为空值要么等于关系s中的某个元组的值自然连接和等值连接的区别于联系等值连接:是从两个关系的笛卡尔积中选取连接属性满足相等条件的所有元组。自然连接:是一种特殊的等值连接它要求两个参与连接的关系具有公共的属性集并且在结果中把重复的属性列去掉第章数据库建模(实体联系模型)请简要解释下列术语:实体、实体集、属性、域、联系、联系集、角色、映射基数、超码、候选码、主码、弱实体、类层次、聚合实体是客观世界中可区别于其他事物的“事物”或“对象”。实体既可以是有形的实在的事物也可以是抽象的、概念上存在的事物。相同类型的实体组成的集合称为实体集实体是通过一组属性来描述的其属性是实体集中给每个实体都具有的性质。每个属性所允许的取值范围或集合称为该属性的域联系两个或两个以上实体之间的联系。相同类型联系组成的集合称为联系集。联系也可拥有自身的描述性属性由于参与一个联系的实体集通常是不同的因而角色是隐含的并且常常不需声明。但是当参与联系的实体来自相同的实体集则需要声明角色映射基数指一实体集中的一个实体通过一个联系集能同时与另一个实体集相联系的实体数目。映射基数可决定联系集的主码属性甚至可能影响到一个事物是作为实体还是联系的选择超码是指能够唯一的标识实体集或联系集中的一个实体或一个联系的一个或多个属性的集合。当一个超码的任意真子集都不能成为超码时称该最小超码为候选码。候选码和超码是实体集客观存在的特性而主码是被数据库设计者主观选中用来区分同一实体集中不同实体的候选码当一个实体集的所有属性都不足以形成主码就称该实体集为弱实体集。相反其属性可以形成主码的实体集称为强实体集。弱实体集所以来的强实体集称为标识实体集。标识实体集和弱实体集之间必须是一对多关系并且弱实体集中的实体在联系集中是全部参与的ER模型使用继承和ISA联系来描述实体集之间概念上的层次关系。当欲建立联系间的联系时可使用聚合实现聚合是一种抽象它将一个联系集及其相关联的实体集抽象为一高层实体集对待然后建立该高层实体集与其他实体集之间的联系集综合题:需求分析ER图关系模式第章数据库存储结构数据库系统的存储访问方式是什么?为什么要这样一个数据库映射为多个不同的文件这些文件由底层的操作系统来维护永久地存放在磁盘上并且具有三级存储介质上的备份。每个文件分成定长的存储单元称为块。块是存储分配和数据传输的基本单位当数据库系统中的程序需要磁盘上的块时它向缓冲区管理器发出请求(即调用)。如果这个块已经在缓冲区中缓冲区管理器将这个块在主存储器中的地址返回给请求者。如果这个块不再缓冲区中缓冲区管理器首先在缓冲区中为这个块分配空间如果需要的话会把其他块移出主存储器为这个新块腾出空间移出的块仅当它在最近一次写回磁盘后修改过才需要写回磁盘然后换红区管理器把这个块从磁盘读入缓冲区并将这个块在主存储器中的地址返回给请求者。缓冲区管理器的内部动作对发出磁盘块请求的程序是透明的。原因:数据库系统的一个主要目标就是减少磁盘和主存储器之间传输的块数。减少磁盘访问次数的一种方法是在主存储器中保留尽可能多的块目的是最大化要访问的块已经在主存储器中的几率这样就不再需要访问磁盘了什么是聚集文件组织、什么是多表聚集文件组织?为什么需要多表聚集文件组织为什么要慎用多表聚集文件组织?聚集文件组织:很多关系数据库系统将各个关系存储在一个个独立的文件中不同关系中有联系的数据是通过关系间的联接操作得到的但是当数据的数量比较大时这种方法速度会很慢。而在聚集文件组织方式中一个文件可以存储多个关系的记录不同关系中有联系的记录存储在一起可以提高查找速度。多表聚集文件组织:在一个块中存储两个或多个关系的相关记录以加速特定连接的处理。但是它将会导致其他类型查询的处理变慢为什么需要索引?什么是顺序索引和散列索引?什么是主索引和辅助索引?稠密索引和稀疏索引有什么不同?什么是索引顺序文件?许多查询只涉及到文件中的少量记录索引能使系统直接定位这些满足查询条件的记录。DBMS首先会查找索引找到对应记录所在的位置(即所在磁盘的块地址)然后读取该磁盘块得到所需的记录顺序索引是基于搜索码的值的顺序排列用于支持快速地对文件中的记录进行顺序或随机的访问。散列索引时通过搜索码值的散列函数的值将所有记录平均、随机地分布到若干个散列桶中用于支持快速地对文件中的记录进行随机地访问如果索引文件中的记录按照某个搜索码值指定的顺序物理存储那么该搜索码对应的索引就称为主索引也叫聚集索引。与此相反搜索码值顺序与索引文件中记录的物理顺序不同的那些索引称为辅助索引或非聚集索引如果索引文件中的每一个不同的搜索码值在索引中都有一个索引记录(或称为索引项)则该索引称为稠密索引。如果只对索引文件中的部分搜索码值在索引中存在一个索引记录则该索引称为稀疏索引。每一个索引项包含搜索码值和指向具有该搜索码值的第一个数据记录的指针。利用稠密索引通常可以比稀疏索引能够更快地定位一条记录的位置但是稀疏索引占用空间更小插入、删除和更新的开销也会更小建立了主索引的索引文件称为索引顺序文件:稠密索引、稀疏索引B树索引的根结点非叶结点和叶结点都具有相同的数据结构那它们之间有什么不同?非叶结点的结构与叶结点结构相同只不过非叶结点中的所有指针都是指向B树种下一层节点的指针根结点与其他非叶结点不同它包含的指针书可以小于n但至少包含两个指针散列文件组织和散列索引有什么不同?在散列文件组织中通过计算一条记录的搜索码值的散列函数值可以直接获得包含该记录的磁盘块(桶)的地址。在散列索引组织中把搜索码值以及与它们先关联的记录指针组织成一个散列文件结构在考虑用索引时是选择B树索引还是散列索引?为什么?散列其实就是一种不通过值的比较而通过值的含义来确定存储位置的方法它是为有效地实现等值查询而设计的。不幸的是基于散列技术不支持范围检索。而基于B树索引技术能有效的支持范围检索并且它的等值检索效果也很好。但是散列技术在等值连接中是很有用的尤其是在索引嵌套循环连接方法中基于散列的索引和基于B树的所以在代价上会有很大差别数据库物理设计的主要内容是什么?数据库物理设计的目标是什么?数据库物理设计的目标是:提高数据库性能以满足应用的性能需求有效利用存储空间在性能和代价之间做出最优平衡数据库物理设计的内容包括:确定数据库性能以满足应用的性能需求有效利用存储空间在性能和代价之间做出最优平衡第章查询处理查询处理的过程分为哪几个步骤语法分析与翻译查询优化查询执行查询代价如何度量?为什么?查询处理的代价可以通过该查询对各种资源的使用情况进行度量主要包括磁盘存取时间和执行一个查询所用CPU时间以及在并行分布式数据库系统中的通信开销等如何实现选择运算?用于选择运算的搜索方法不用索引的搜索算法文件扫描使用索引的搜索算法索引扫描题见书()最坏情况下缓冲区只能容纳每个关系的一个数据块因而算法的代价为:EJ=nr*bsbr。这里nr=bs=br=所以所需要的块存取数为*约为M个块存取。最好情况下两个关系都能放到内存里因而算法代价为:EJ=bsbr。大约需要K个块存取。为什么需要查询优化?什么是查询执行计划?查询优化器的输入和输出分别是什么?处理一个给定的查询尤其是复杂的查询通常会有许多种策略。查询优化就是从这多种策略中找出最有效的查询执行计划的处理过程。给定一个关系代数表达式查询优化器的任务就是产生一个查询执行计划该计划能获得与原关系代数表达式相同的结果并且执行代价是接近最小的题见书:由于是计算三个关系的自然连接且连接属性中的C、E是各自关系的主码因此rrr的大小最多为个元组。有效地计算这个连接的策略就是让连接结果较小的连接运算先执行即:(rr)r。原因就是:由于A是r的主码C是连接属性因此rr的最大结果为个元组而C是r的主码E是连接属性因此rr的最大结果为个元组。所以要让(rr)先做连接运算以减少结果集的大小。画树其它章节零散习题列级约束和元组级约束的区别在哪里?如果在定义属性的同时定义约束条件则为列级约束如果单独定义约束条件则为元组级约束什么是事物的ACID特性?原子性:事务的所有操作要么全部都被执行要么都不被执行一致性即一个单独执行的事务应保证其执行结果的一致性即总是将数据库从一个一致性状态转化到另一个一致性状态隔离性:即当多个事务并发执行时一个事务的执行不能影响另一个事务即并发执行的各个事务不能相互干扰持久性:即一个事务成功提交后它对数据库的改变必须是永久的即使随后系统出现故障也不会受到影响当前主流的数据库访问技术是ADOWeb服务器的职责是什么?数据库服务器的职责又是什么?Web服务器负责监听客户的请求一旦收到客户请求数据库服务器

类似资料

编辑推荐

Nonlinear Continuum Mechanics for Finite Element Analysis 2Edition.pdf

宋玉辞赋译解(朱碧莲 中国社科1987).pdf

[存在与时间 讲解].doc

[一个巴黎女子的拉萨历险记].(法)大卫.妮尔.扫描版.pdf

[西藏探险].Tibet.Exploration.(美)约翰·麦格雷格.扫描版.pdf

职业精品

精彩专题

上传我的资料

精选资料

热门资料排行换一换

  • 夏源流史.pdf

  • 重新理解马克思+对马克思哲学的基…

  • 东夷源流史.pdf

  • 楚源流史.pdf

  • (法)夏尔·贝特兰《毛泽东逝世后…

  • 江华锦江怡苑三折页1637343…

  • 魏晋南北朝史札记.周一良.中华书…

  • 经济分析基础.pdf

  • 宋词鉴赏辞典.txt

  • 资料评价:

    / 6
    所需积分:5 立即下载

    意见
    反馈

    返回
    顶部