数据库原理
一、名词解释
1.DBS:数据库系统(DataBase System),是指计算机系统中引入数据库后的系统构成,由计算机硬件、操作系统、DBMS、DB、应用程序和用户以及数据库开发和管理人员等组成。
2.ERP:企业资源规划(Enterprise Resource Planning)。
3.GIS:地理信息系统(Geographic Information System)。
4.CAD:计算机辅助设计(Computer-Aided Design)。
5.DB:数据库(DataBase),是存储在计算机系统内的有结构的数据集合。
6.DDL:数据定义语言(Data Definition Language),用户利用DDL可以方便地定义数据库中数据的逻辑结构。
7.DML:数据操纵语言(Data Manipulation Language),用户利用DML可以实现对数据库中数据的各种操作。
8.DCL:数据控制语言(Data Control Language),用来实现对不同级别用户的访问控制功能。
9.DBA:数据库管理员(DataBase Administrator),是数据库所属单位的代表。
10.SA:系统分析员(System Analyst)。
11.DBMS:数据库管理系统(DataBase Management System),是在操作系统支持下工作的数据管理软件,是支持用户创建和维护数据库的一组程序包。
12.RDBMS:关系型数据库管理系统,通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据。
13.B/S:浏览器/服务器系统,是基于互联网的一种分布式结构方式,一般由客户机、应用服务器及数据库服务器三部分组成;C/S:客户/服务器系统杭州电子科技大学
14.Relation:关系,一个关系可用一个表来表示,每个关系(表)都有与其他关系(表)不同的名称。
15.Attribute:属性,关系中的每一列即为一个属性。
16.Domain:域,一个属性的取值范围就是该属性的域。
17.Tuple:元组,关系中的一行数据总称为一个元组。
18.Component:分量,一个元组在一个属性上的值称为该元组在此属性上的分量。
19.Candidate Key:候选码,一个关系中的某个属性(或属性组)的值能唯一标识关系中的各个元组,且又不含有多余的属性,则该属性称为该关系的一个候选码,也称码(key)。
20.Primary Key:主码,若一个关系中有多个候选码,则选取其中一个为主码。每个关系都有且只有一个主码。
21.Main Attribute:主属性,包含在任何一个候选码中的属性称为主属性,不包含在任何候选码中的属性称为非主属性或非码属性。
22.Foreign Key:若A是基本关系R1的属性,但不是R1的码,且A与基本关系R2的码K相对应,则称A是R1的外部码。
23.view:视图,一个视图是从一个或多个关系导出的关系。
24.projection:投影
25.selection:选择
26.join:连接,其中equivalence join为等值连接,natural join为自然连接,outer join 为外连接。
28.division:除
29.locking:封锁,是普遍采用的一种并发控制手段,可避免并发操作出现的问题。
二、知识归纳
数据库系统概论
1.DBS(数据库系统)的特点:①整体数据结构化;②数据的共享度高;③数据的独立性高;
④高度的数据控制能力(体现在较高的数据安全性、较好地数据完整性、较强的并发控制能力和较强的数据恢复能力)。
2.DBMS(数据库管理系统)的功能:①数据定义;②数据操纵;③完整性约束检查;④访问控制;⑤并发控制;⑥数据库恢复。
3.DBA(数据库管理员)的职责:①在用户与数据库开发人员之间进行协调和沟通;②参与数据库设计
工作;③决定数据的完整性约束条件和不同用户的存取权限;④保证数据库的正常运行和数据库的维护工作;⑤提出数据库的重构计划。
4.数据库系统中DB(数据)的三级模式结构:①外模式(external schema是个别用户组的数据库视图,每个外模式描述的是一个特定用户组所感兴趣的那部分数据,而该用户组隐藏了数据库的其他部分);②模式(schema是数据库中全体数据在逻辑上的视图,通常以某种数据模型为基础,定义数据库中全部数据的逻辑结构);③内模式(internal schema 既定义了数据库中全部数据的物理结构,还定义了数据的存储方法、存取策略等)。
5.数据独立性:包括数据的逻辑独立性和物理独立性,其中逻辑独立性是指当数据库的模式发生改变时,只需要改变存在于外模式和概念模式之间的映射转换,无需改变外模式或应用程序;物理独立性是指当数据库的内模式发生改变时,系统只需要改变概念模式和内模式之间的映射转换而不必改变模式。
6.SQL中的三级模式结构:①基本表;②视图;③存储文件。
建立数据模型
1.三个世界:①现实世界;②信息世界;③数据世界。
2.基本概念:①实体(entity):是可观事物的反映,可以是实际的对象也可以是某概念;②属性(attrib
ute):是事物特有的属性,如:职工实体的属性有职工号、年龄等;③域(domain):一个属性的取值范围就是这个属性的域;④实体集(entity set):实体的集合;⑤实体型(entity type):实体集的名称及其所有属性名的集合;⑥码(key):在一个实体集中,根据一个或几个属性的值可以唯一确定每一个实体,而又没有包含多余的属性,则称此属性或属性组为该实体集的码,例如职工号就是职工实体的码。
3.实体-联系模型(E-R模型):E-R图中主要有三个元素类型:实体集、属性和联系。用矩
形框表示实体集,用椭圆表示属性,实体的码用下划线表示,实体集之间的联系集用菱形表示,并用无向边与相关实体集连接,菱形中写上联系名,无向边写上联系集的类型。
4.联系:分为一对一联系、一对多联系和多对多联系。多元联系则是指有两个以上实体集之间的联系。联系同样具备属性,如:当一个公司希望签约一个演员时,酬金既不能作为演员的属性也不能作为公司的属性,应该是两者之间的联系--”签约“的属性。
5.弱实体集:一个实体集的属性不足以形成码,就称为弱实体集。而有码的实体集则为强实体集。
6.E-R模型的设计原则:①相对原则:在不同的情况下可能会有不同的结果;②一致原则:同一对象在不同业务系统中的抽象结果要求一致,业务系统是指建立系统的各子系统;③简单原则:能作为属性对待的都作为属性处理。
7.满足属性的条件:如果某实体满足下列两点之一就能作为属性对待:①属性不再具有需要描述的性质;②属性不能再与其他实体集具有联系。
8.局部E-R模型设计步骤:①确定局部应用范围;②确认实体集;③确认实体集之间的联系集;④确认实体集的属性;⑤确认联系集的属性;⑥画出局部E-R模型。
9.集成局部E-R模型:主要是要消除三类冲突:①命名冲突(如对于实体集职工,人事部门称之为职工,而科研部门称之为科研人员);②属性冲突(如:职工号在体格局部E-模型中定义为整数,在另一个E-R模型中定义为字符串);③结构冲突(如:在人事管理局部E-R 模型中工资是职工的属性,在工资管理局部E-R模型中工资是实体集)。
10.消除冗余:①实体联系尽可能少(有时需要合并相关的实体集,如1:1联系的两个实体集、具有相同码的实体集均可以合并);②实体集所含属性尽可能少;③实体集之间联系无冗余。
11.数据模型及其三要素:主要的数据模型有:层次模型、网状模型、关系模型和面向对象。数据模型的三要素是:数据结构、数据操作和完整性约束三部分组成。
12.关系模型:关系模型中数据的逻辑结构是关系,关系可用二维表表示如:
职工号姓名性别年龄
1002胡一鸣男12
1004王爱明男26
1005张晓华女31
关系模型中的主要术语有:①关系:一个关系可以用表来表示;②属性:关系中的每一列即一个属性;③域:一个属性的取值范围就是该属性的域;④元组:关系中的一行数据总称为一个元组;⑤分量:一个元组在一个属性上的值称为该元组在此属性上的分量;⑥候选码;
⑦主码:若关系中有多个候选码,选一个且只能有一个作为主码;⑧主属性:包含在任何一个候选码中的属性称为主属性,反之称为非主属性;⑨外部码:若A是基本关系R1的属性,但不是R1的码,且A与基本关系R2的码K相对应,则称A是R1的外部码;
13.关系模式:一个关系的关系名及其全部属性名的集合称为该关系的关系模式,一般表示为:关系名(属性名1,属性名2,属性名3.....),如职工(职工号,姓名,性别,年龄)14.关系模型的三类完整性:①实体完整性(规定任一候选码的任何属性都不能为空);②参照完整性(例如,如果在学生表和选修课之间用学号建立关联,学生表是主表,选修课是从