四川应用型自考 四川自考【课程】【书籍】订购入口

自学考试互联网数据库1-11章问答资料

发布日期:2018-05-23 12:26:01 编辑整理:四川自考网 【字体:

§1
1.数据库技术是随着数据管理的需要而产生的。数据处理的的核心是数据管理。数据管理指的是对数据的分类、组织、编码、储存、检索和维护。

2.数据管理技术共经历了三个阶段:
人工管理阶段、文件系统阶段、数据库系统阶段

3. 人工管理阶段:
数据不保存、数据需要由应用程序自己进行管理、
基本上没有文件概念、数据不共享

4.文件系统阶段:
  数据可以长期保存、文件系统管理数据、
文件已经多样化、数据的存取基本上以记录为单位。
  缺点有:数据共享性差,数据冗余度大;数据和程序缺乏独立性

5.数据库管理阶段:
(1)数据结构化。
(2)数据共享性高、冗余度小、易扩充。
(3)数据独立性高。
 (4)统一的数据管理和控制:数据的安全性保护、数据的完整性控制、数据库恢复和并发控制。
(5)数据的最小存取单位是数据项。
DB:数据库(Database),DB是统一管理的相关数据的集合。
DBMS:数据库管理系统(Database Management System),DBMS是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。
DBS:数据库系统(Database System),DBS是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。
数据库技术:是一门研究数据库结构、存储、管理和使用的软件学科。
第一代数据库系统,即层次数据库系统和网状数据库系统
第二代数据库系统,即关系数据库系统
第三代数据库系统,即面向对象数据库系统 
数据库学科的研究范围:数据库管理系统软件的研制; 数据库设计;  数据库理论

数据模型是现实世界数据特征的抽象。是数据库系统的核心和基础。 
数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。
根据模型应用目的分为:⑴概念模型,也称信息模型,它是按用户的观点对数据和信息建模。⑵数据模型,主要包括层次模型、网状模型、关系模型和面向对象数据模型,它是按计算机系统的观点对数据建模。

数据模型三个要素: 
⑴数据结构  描述系统的静态特性
⑵数据操作  描述系统的动态特性
⑶数据的约束条件  是一组完整性规则的集合
概念模型
数据描述的三个领域:现实世界、信息世界和机器世界
 
数据描述的两种形式:物理描述和逻辑描述。前者是指数据在存储设备上的存取方式,后者是指程序员或用户以用以操作的数据形式。
两个实体型之间的联系可以分为三类:
一对一联系(1∶1);一对多联系(1∶n);多对多联系(m∶n)
E-R图提供了表示实体型、属性和联系的方法。实体-联系方法(E-R方法)是抽象和描述现实世界的有力工具。
 实体型:用矩形表示,矩形框内写明实体名。
 属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。
 联系:用菱形表示,菱形框内写明联系名,并用无向边分别志有关实体连接起来,同时在无向边旁标上联系的类型(1∶1,1∶n或m∶n)。
 

数据模型
数据模型:  层次模型、网状模型、关系模型和面向对象数据模型。
其中层次模型和网状模型统称为非关系模型。
层次模型:用树型结构表示实体间联系的数据模型
层次模型有以下两个限制:
⑴只有一个结点没有双亲结点,称之为根结点;
⑵根以外的其他结点有且只有一个双亲结点。
层次数据模型可以直接表示一对多(包括一对一)的联系;
层次模型表示多对多联系,必须首先将其分解成一对多联系。分解方法有两种:冗余结点法和虚拟结点法。
网状模型:用有向图结构表示实体类型及实体间联系的数据模型。
(1)允许一个以上的结点无双亲;(2)一个结点可以有多于一个的双亲。
关系模型:是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。
关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。
数据系统的三级模式结构:外模式(物理模式)、模式(逻辑模式)和内模式
 
两级映象:
外模式/模式映象  一般在外模式中描述。
模式/内模式映象  一般在内模式中描述。
两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
数据库管理系统的功能: 
⑴数据定义
⑵数据操纵
⑶数据库运行管理
⑷数据组织、存储和管理
⑸数据库的建立和维护
⑹数据通信接口
数据库管理系统组成:
⑴数据定义语言及其翻译处理程序 
⑵数据操纵语言及其编译(或解释)程序
⑶数据库运行控制程序
⑷实用程序
一个设计优良的DBMS:
⑴友好的用户界面
⑵比较完备的功能
⑶较高的运行效率
⑷清晰的系统结构和开放性

§2
关系数据库系统与非关系数据库系统的区别是,关系系统只有"表"这一种数据结构;而非关系数据库系统还有其他数据结构,对这些数据结构有其他的操作。
关系模型的组成:关系数据结构、关系操作集合、关系完整性约束
关系数据语言 
关系代数语言 例如ISBL
 
元组关系演算语言 例如ALPHA,QUEL
关系演算语言
域关系演算语言 例如QBE
具有关系代数和关系演算双重特点的语言 例如SQL

关系的三类完整性约束:实体完整性、参照完整性和用户定义的完整性

实体完整性规则:要求关系中组成主键的属性上不能有空值。
参照完整性规则:要求不引用不存在的实体。
用户定义完整性规则:由具体应用环境决定,系统提供定义和检验这类完整性的机制。

关系数据语言的共同特点是:语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。

基本关系具有以下六条性质:
①列是同质的(Homogeneous),即每一列中的分量同一类型的数据,来自同一个域。②不同的列可出自同一个域,称其中的每列为一个属性,不同的属性要给予不同的属性名。
③列的顺序无所谓,即列的次序可以任意交换。
④任意两个元组不能完全相同。
⑤行的顺序无所谓,即行的次序可以任意交换。
⑥分量必须取原子值,即每一个分量都必须是不可分的数据项。
  关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件。这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。

关系是关系模式在某一个时刻的状态或内容。关系模式是静态的,稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。但在实际当中,人们常常把关系模式和关系都称为关系。

实体完整性规则说明如下:
(1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一  个实体集。例如学生关系对应于学生的集合。
(2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。
(3)相应地,关系模型中以主码作为唯一性标识。
(4)主码中的属性即主属性不能取空值。所谓空值就是"不知道"或"无意义"的值。
关系可以有三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表
元组变量主要有两方面的用途:
  ①简化关系名。
  ②操作条件中使用量词时必须用元组变量。

§3
SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体。
特点包括:①综合统一、②高度非过程化、③面向集合的操作方式、④以同一种语法结构提供两种使用方式、⑤语言简洁,易学易用。
定义和合理地使用视图能带来的好处为:
  ⑴、视图能够简化用户的操作
  ⑵、视图使用户能以多种角度看待同一数据
  ⑶、视图对重构数据库提供了一定程度的逻辑独立性
  ⑷、视图能够对机密数据提供安全保护
  视图更新操作规则的限制:
如果视图是从多个基本表使用联接操作导出的,则不允许更新。
如果导出的视图使用了分组和聚合操作,也不允许更新。
如果视图是从单个基本表使用选择和投影操作导出的,并且包括了基本表的主键或某个候选键,则可以执行操作。

SQL中数据控制功能包括事务管理功能和数据保护功能,即数据库的恢复、并发控制;数据库的安全性和完整性。

§4
数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。现在人们已经提出了许多种类型的数据依赖,其中最重要的是函数依赖和多值依赖。
  关系模式规范化时一般应遵循以下原则:
  (1)关系模式进行无损连接分解。
(2)合理选择规范化程度。
  (3)正确性与可实现性原则。
关系模式规范化的基本步骤如图所示。
  ①对1NF关系进行投影,消除原关系中非主属性对码的函数依赖,将1NF关系转换为若干个2NF关系。
  ②对2NF关系进行投影,消除原关系中非主属性对码的传递函数依赖,从而产生一组3NF关系。
  ③对3NF关系进行投影,消除原关系中主属性对码的部分函数依赖和传递函数依赖(也就是说,使决定属性都成为投影的候选码),得到一组BCNF关系。
消除决定属性集非码的非平凡函数依赖 
1NF
 
消除非主属性对码的部分函数依赖
2NF
 
消除非主属性对码的传递函数依赖
3NF
 
消除主属性对码的部分和传递函数依赖
BCNF
 
消除非平凡且非函数依赖的多值依赖
4NF
 
消除不是由候选码所蕴含的连接依赖
5NF
以上三步也可以合并为一步:对原关系进行投影,消除决定属性不是候选码的任何函数依赖。
  ④对BCNF关系进行投影,消除原关系中非平凡且非函数依赖的多值依赖,从而产生一组4NF关系。
  ⑤对4NF关系进行投影,消除原关系中不是由候选码所蕴含的连接依赖,即可得到一组5NF关系。
  5NF是最终范式。
1NF/2NF/3NF存在的问题: ①插入异常 ②删除异常 ③数据冗余度大 ④修改复杂
BCNF问题:①数据冗余度大  ②增加操作复杂  ③删除操作复杂  ④修改操作复杂 
关系模式分解的三个定义(判断对关系模式的一个分解是否与原关系模式等价可以有三种不同的标准):
  (1)分解具有"无损连接性"。
  (2)分解要"保持函数依赖"。
  (3)分解既要"保持函数依赖",又要具有"无损连接性"。
规范化理论提供了一套完整的模式分解算法,按照这套算法可以做到:
①若要求分解具有无损连接性,那么模式分解一定能够达到4NF。
②若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF。
③若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNF

BCNF的关系模式都具有如下3个性质:
  ①所有非主属性都完全函数依赖于每个候选码。
  ②所有主属性都完全函数依赖于每个不包含它的候选码。
  ③没有任何属性完全函数依赖于非码的任何一组属性。

§5
数据库的被破坏主要有以下几个方面:
  (1)系统的软、硬件故障,造成数据被破坏。
  (2)数据库的并发操作引起数据的不一致性。
  (3)自然的或人为的破坏。
  (4)对数据库数据的更新操作有误。
  针对上述问题,数据库管理系统提供相应的功能:
  (1)数据库恢复:在系统失效后的数据库恢复,配合定时备份数据库,使数据库不丢失数据。
  (2)并发控制:保证多用户能共享数据库,并维护数据的一致性。
  (3)安全性保护:防止对数据库的非法使用,以避免数据的泄露、纂改或破坏。
  (4)完整性保护:保证数据的正确性和一致性。

数据库安全控制的一般方法:
①用户标识和鉴定;②存取控制;③定义视图;④审计;⑤数据加密。

数据库的安全性主要是指保护数据库,防止由于非法使用数据库造成数据泄露、更改或破坏。数据库的完整性:数据的正确性、一致性和相容性。
数据的完整性与安全性是数据库保护的两个不同的方面。安全性是防止用户非法使用数据库。完整性则是防止合法用户使用数据库时向数据库中加入不合语义的数据。
事务:并发控制的单位,是用户定义的一组数据库操作序列。
特征:原子性、一致性、隔离性、持久性。


  并发控制的主要技术是采用封锁机制。封锁就是事务T可以向系统发出请求,对某个数据对象(最常用的是记录)加锁。于是事务T对这个数据对象就有一定的控制。基本的封锁类型有两种:排它锁(X锁)和共享锁(S锁)。

和操作系统一样,封锁的方法可能引起活锁和死锁。
活锁是指当若干事务要对同一数据项加锁时,造成一些事务的永远等待,得不到控制权的现象;死锁是指两个以上事务集合中的每个事务都在等待加锁当前已被另一事务加锁的数据项,从而造成相互等待的现象。

数据库中解决死锁的常用方法有:
  ⑴、要求每个事务一次就将所有要使用的数据全部加锁,否则就不能执行。
  ⑵、采用按序加锁法。
  ⑶、不采取任何措施来预防死锁的发生,而是周期性的检查系统中是否有死锁。

可串行化的调度:如果几个事务并行(交错)执行的结果和按次序串行执行的结果相同,则称该并行执行结果是正确的。这样的调度称为可串行化的调度。

两段锁协议是指所有事务必须分两个阶段对数据库项加锁和解锁。
两段锁协议规定所有的事务应遵守下列规则:
  ⑴、在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁。
  ⑵、在释放一个封锁之后,事务再获得任何其他封锁。
  所谓“两段”锁含义是:事务分为两个阶段。第一阶段是获得封锁,也称为扩展阶段。在该阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。第二阶段是释放封锁,也称为收缩阶段。在该阶段,事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。
数据库系统故障可分为:事务内部的故障、系统故障、介质故障、计算机病毒。

转储:静态转储(转储期间不允许对数据库进行任何存取、修改活动)
  动态转储(转储期间允许对数据进行存取或修改)
  海量转储(每次转储全部数据库)
  增量转储(每次只转储上次转储后更新过的数据)
日志文件是用来记录对数据库每一次更新活动的文件。在转储中必须建立日志文件,后援副本和日志文件综合起来才能有效地恢复数据库。

利用日志文件恢复事务的过程:
①从头扫描日志文件,找出哪些事务在故障发生时已经结束,哪些事务尚未结束;
②对尚未结束的事务进行撤销处理,对已经结束的事务进行重做处理。


①硬件故障;病毒破坏:当数据库本身被破坏时,可重装转储数据库的后备副本,然后运行日志文件,执行事务恢复,这样就可以重建数据库。
②发生事务故障;系统故障:当数据库本身没被破坏,但内容已经不可靠时,可利用日志文件恢复事务,从而使数据库回到某一正确状态,这时不必重装后备副本。

§6
信息系统是提供信息、辅助人们对环境进行控制和进行决策的系统。数据库是信息系统的核心和基础。
 数据库设计内容:结构(数据)设计;行为(处理)设计。
数据库设计分为以下六个阶段:①需求分析阶段、②概念结构设计阶段、③逻辑结构设计阶段、④数据库物理设计阶段、⑤数据库实施阶段、⑥数据库运行和维护阶段。
数据库设计过程中注意的问题:
  (1)数据库设计过程中要充分调动用户的积极性。
  (2)应用环境的改变、新技术的出现等都会导致应用需求的变化,因此在设计数据库时必须充分考虑到系统的可扩性。
  (3)在设计数据库应用的过程中,必须充分考虑到已有应用,尽量使用户能够平稳地从旧系统迁移到新系统。

调查的重点是"数据"和"处理",通过调查、收集与分析,获得用户对数据库的要求:
  (1)信息要求。指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求,即在数据库中需要存储哪些数据。
  (2)处理要求。指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。
  (3)安全性与完整性要求。
数据字典:是系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。
数据字典包括:数据项、数据结构、数据流、数据存储、处理过程。
数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。

在需求分析阶段需要注意的是:
  (1)需求分析阶段的一个重要而困难的任务是收集将来应用所涉及的数据,设计人员应充分考虑到可能的扩充和改变,使设计易于更改,系统易于扩充,这是第一点。
  (2)必须强调用户的参与,这是数据库应用系统设计的特点。数据库应用系统和广泛的用户有密切的联系。因此用户的参与是数据库设计不可分割的一部分。在数据分析阶段,任何调查研究没有用户的积极参加是寸步难行的。设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果承担共同的责任。

概念结构的主要特点是:
  (1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。
  (2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。
  (3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。
  (4)易于向关系、网状、层次等各种数据模型转换。
设计概念结构通常有四类方法:
 自顶向下、自底向上、逐步扩张、混合策略。
实际上实体与属性是相对而言的,实体与属性之间并没有形式上可以截然划分的界限,但可以给出两条准则:
  (1)作为"属性",不能再具有需要描述的性质。"属性"必须是不可分的数据项,不能包含其他属性。
  (2)"属性"不能与其他实体具有联系,即E-R图中所表示的联系是实体之间的联系。
  凡满足上述两条准则的事物,一般均可作为属性对待。

关系数据模型的优化通常以规范化理论为指导,方法如下。
①、确定数据依赖。
②、对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。
③、按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多值依赖等,确定各关系模式分别属于第几范式。
④、按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行合并或分解。

数据库的物理结构依赖于所选用的DBMS,依赖于计算机硬件环境,设计人员进行设计时主要需要考虑以下几个方面:
确定数据的存储结构、设计数据的存取路径、确定数据的存放位置、确定系统配置。

数据库实施主要包括以下工作:
 ①、定义数据库结构
 ②、数据装载
③、编制与调试应用程序
④、数据库试运行
数据库维护工作主要内容:
  ①、数据库的转储和恢复
  ②、数据库的安全性、完整性控制
  ③、数据库性能的监督、分析和改进
  ④、数据库的重组织和重构造
 
§7
URL组成:
检索协议、Internet节点、为HTTP客户服务的资源文件名。

CGI是外部应用程序(CGI程序)与Web服务器之间的接口标准,是在CGI程序和Web服务器之间传递信息的规程。CGI规范允许Web服务器执行外部程序,并将它们的输出发送给Web浏览器。CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体。
CGI程序调用方式:
①通过交互式主页里的表单栏(FORM)调用CG1程序,用户在填完一张表单后,按确认按钮就启动了CGI程序。
②通过URL直接调用CGI程序。

CGI的主要优点是它的简单、语言无关性、Web服务器无关性以及它广泛的可接受性。
虽然CGI提供了一种与数据库连接的简单方法,但它也存在一些局限性。
⑴瓶颈问题,客户机和数据库服务器之间的通信必须通过Web服务器,当有大量的用户访问时,Web服务器会"超载"。
⑵缺乏效率和事务支持,CGI应用程序不能由多个客户机请求共享,降低了性能,增加了等待时间。
⑶CGI应用程序不持久,服务器必须为每次访问CGI程序建立新的进程或线程,每次请求时数据库连接都必须重新打开,开销很大。
⑷CGI程序安全性问题

ASP文件组成部分:
(1)文本;
(2)HTML标记,可单独使用或嵌入在各个ASP脚本单元中,以" <和>"为定界符;
(3)VBScript(或JScript)语句,可单独使用或嵌入在各个ASP脚本单元中,以(SCRIPT和/SCRIPT)为定界符,通过对"RUN AT"属性的设置来决定是否在服务器端运行;
(4)ASP脚本命令:可单独使用或包含在此和〈/html〉内,以"〈%"和"%〉"为定界符。

API是驻留在Web服务器上的程序代码,它扩展了服务器的性能,其方式类似于CGI。
ActiveX是Microsoft提出的一种标准,AcitveX也是Microsoft一组软件技术的统称,包括控件、文档、脚本三种最常用的技术,以及Microsoft的许多其他技术。
Active Server Pages(ASP)是 Microsoft基于服务器的、建立动态和交互式 Web页面的技术,它是建立在ISAPI技术基础上的,并克服了CGI存在的缺点。
ADO包括七个对象:三个主对象为连接对象、命令对象、记录集对象。错误对象、字段对象、参数对象、属性对象

§8
JDBC是执行SQL语句的Java API。JDBC即“Java Database Connectivity”(Java数据库连接),它由一组用Java语言编写的类与接口组成,已成为一种数据库连接的标准。
JDBC与ODBC以及其他API的区别:① Java不能直接使用ODBC,因为是ODBC使用C语言接口,如果让Java来调用本机C代码,将会在安全、属性、健壮性、应用的可移植性等方面带来困难。②不希望把ODBC API逐字地翻译成Java API,例如ODBC使用了大量易出错地指针,而Java取消了这种不安全地指针。③ODBC难以学习,它把简单功能和高级功能混杂在一起,即便是简单的查询语句也会带来复杂的任选项。而JDBC的设计使得简单的事情用简单的方法做,仅在必要时才让用户使用高级功能。④JDBC的Java API提供“纯Java”的解决方法。当使用ODBC时,ODBC驱动器管理程序与驱动器必须手动地装入到每台客户机上。而JDBC驱动器全是用Java编写的,ODBC代码可在所有Java平台上自动安装,并且是可移植的和安全的。

JDBC的特点:JDBC是低级的API,是高级API的基础。JDBC是一种低级的接口,它直接调用SQL命令,但又可以作为构造高级接口和工具的基础。在执行时,高级API将首先被翻译成如JDBC这样的低级接口。
JDBC的基本功能包括:建立与数据库的连接、发送SQL语句、处理结果。

JDBC提供了连接数据库的几种方法:
①与数据源直接通信;②通过JDBC驱动程序的通信;③与ODBC数据源通信
利用JDBC访问数据库的Java应用程序有两种:一种是本身就有数据访问功能的Java程序,另一种是使用JDBC做媒介的Java应用程序

JDBC API提供的类或接口主要包括:
Java.sql.DriverManager 处理驱动程序的装载和建立新的数据库连接。
Java.sql.Connection 完成对某一指定数据库的连接。
Java.sql.Statement 管理在一指定数据库连接上的SQL语句的执行。
Java.sql.ResultSet 从数据库返回的结果集。
客户端的Java应用程序需要完成的工作有:
  1)与JDBC服务器建立连接;
  2) 装载JDBC/ODBC驱动器;
  3)与ODBC数据源建立连接;
  4)发送SQL语句;
  5)得到查询结果;
  6)关闭与JDBC服务器的连接。

编写用JDBC编写能实现数据库连接和断开的程序段:
import java.net.URL;
import java.sq1.*import java.net.URL;
import Java.sq1.*
class jdbc_connect
{
public static void main(String argv[])
{
if(argv.length==0)
{
System.err.println(“检查到空的URL!”); System.exit(1);
}∥end of if
try
{
Class.forName(“textFileDriver”);
Class.forName(“jdbc.odbc.JdbcOdbcDriver”);
Class.forName(“imaginary.sq1.iMsq1Driver”);
String ur1=argv[0];
String user,pwd;
If(argv.length>1)
{
user=argv[1];
}
else
{
user=”” }
If(argv.length>2)
{
pwd=argv[2];
}
else
{
pwd=”” }
Connection con=DriverManager.getConnectiion(ur1,user,pwd);
Con.close();
System.out.println(“连接失败!”); }∥end of try
∥处理连接异常 catch(Exception e)
{
System.out.println(e.getMessage());
e.printStackTrace();
}
}∥end of main
}∥end of class

§9
Active Server Pages(简称ASP)是服务器端脚本环境,所用的语言是Javascript或VBscript,或者是它们两者的结合。
ASP的主要特点如下:
  ①使用VBScript、Jscript等简单易懂的脚本语言,结合HTML代码,即可快速地完成网站的应用程序。
  ②无须编译,容易编写,在服务器端直接执行。
  ③使用普通的文本编辑器即可进行编辑设计。
  ④与浏览器无关,用户端只要使用可执行HTML码的浏览器,即可浏览ASP所设计的网页内容。
  ⑤ASP的源程序不会被传到客户浏览器,因而可以避免所写的源程序被他人剽窃,从而提高了程序的安全性。
  ⑥可使用服务器端的脚本来产生客户端的脚本。

Active Data Object(ADO)是一项容易使用并且可扩展的将数据库访问添加到Web页的技术。
ADO所有重要的接口:
①Connection(连接)  ②Error(错误集)  ③Command(命令)
④Parameter(参数)  ⑤Recordset(游标)  ⑥Field(字段)

创建一个Connection接口通常是调用server对象的CreateObject方法:
  Set myConnection=Server.CreateObject("ADODB.Connection")
(a)直接将连接字符串传给Open方法
 
  (b)利用它的ConnectionString属性
 
ConnectionString的参数  作用
DSN  为数据源名(不可省)
PWD  访问数据源的口令
UID  访问数据源的用户帐号
Provider  为数据提供者
File Name  指定数据源的某个特定的文件

Close方法

  这样,就释放了所有的资源,因此如果想再利用Connection对象,只能重新创建一个了。
创建Command对象:
 

§11
面向对象数据库系统(Object Oriented Data Base System,简称OODBS)是数据库技术与面向对象程序设计方法相结合的产物。
对于OO数据模型(面向对象数据模型)和面向对象数据库系统的研究主要体现在:研究以关系数据库和SQL为基础的扩展关系模型;以面向对象的程序设计语言为基础,研究持久的程序设计语言,支持OO模型;建立新的面向对象数据库系统,支持OO数据模型。


对象-关系数据库系统特点:
(1)扩充数据类型,(2)支持复杂对象,(3)支持继承的概念
(4)提供通用的规则系统

分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力(称为场地自治),可以执行局部应用。同时,每个结点也能通过网络通信子系统执行全局应用。

分布式数据库系统是在集中式数据库系统技术的基础上发展起来的,它的特点:
  一、数据独立性。在分布式数据库中,除了数据的逻辑独立性与物理独立性(集中式数据库特点)外,还有数据分布独立性亦称分布透明性。
  二、集中与自治相结合的控制结构。
  三、适当增加数据冗余度。
  四、全局的一致性、可串行性和可恢复性。
分布式数据库系统的目标,主要包括技术和组织两方面的目标:
  1、适应部门分布的组织结构,降低费用。
  2、提高系统的可靠性和可用性。
  3、充分利用数据库资源,提高现有集中式数据库的利用率。
  4、逐步扩展处理能力和系统规模。

并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。
一个并行数据库系统应该实现如下目标:
1、高性能;2、高可用性; 3、可扩充性

并行数据库系统结构:共享内存(主存储器)结构(SM结构),共享磁盘结构(SD结构)和无共享资源结构(SN结构)。

多媒体数据库是多媒体技术与数据库技术相结合产生的一种新型的数据库。
所谓多媒体数据库是指数据库中的信息不仅涉及各种数字、字符等格式化的表达形式,而且还包括多媒体的非格式化的表达形式,数据管理要涉及各种复杂对象的处理。
在建立多媒体应用环境时必须考虑的问题:
确定存储介质、确定数据传输方式、确定数据管理方式和数据资源的管理。

多媒体数据库与传统的数据库有较大的差别,主要表现在:
  (1)处理的数据对象、数据类型、数据结构、数据模型和应用对象都不同,处理的方式也不同。
  (2)多媒体数据库存储和处理复杂对象,其存储技术需要增加新的处理功能,如数据压缩和解压。
  (3)多媒体数据库面向应用,没有单一的数据模型适应所有情况,随应用领域和对象而建立相应的数据模型。
  (4)多媒体数据库强调媒体独立性,用户应最大限度地忽略各媒体间的差别而实现对多种媒体数据的管理和操作。
  (5)多媒体数据库强调对象的物理表现和交互方式,强调终端用户界面的灵活性和多样性。
  (6)多媒体数据库具有更强的对象访问手段,比如特征访问、浏览访问、近似性查询等。


多媒体的建模方法有多种,常见的有以下几种方法:
(1)扩充关系模型 (2)语义模型(3)对象模型
多媒体数据库管理系统(MDBMS)能实现多媒体数据库的建立、操作、控制、管理和维护,能将声音、图像、文本等各种复杂对象结合在一起,并提供各种方式检索、观察和组合多媒体数据,实现多媒体数据共享。 多媒体数据库管理系统的基本功能应包括如下几点:
  (1)能表示和处理复杂多媒体数据,并能较准确地反映和管理各种媒体数据的特性和各种媒体数据之间的空间或时间的关联,能为用户提供定义新的数据类型和相应操作的能力。
  (2)能保证多媒体数据库的物理数据独立性、逻辑数据独立性和多媒体数据独立性。
  (3)提供功能更强大的数据操纵,比如非格式化数据的查询、浏览功能,对非格式化数据的一些新操作,图像的覆盖、嵌入、裁剪,声音的合成、调试等。
  (4)提供网络上分布数据功能,对分布于网络不同结点的多媒体数据的一致性、安全性、并发性进行管理。
  (5)提供系统开放功能,提供多媒体数据库的应用程序接口(API)。
  (6)提供事务和版本的管理功能。

数据仓库的定义是:在支持管理的决策生成过程中,一个面向主题的、集成的、时变的、非易失的数据集合。
数据仓库的最终目的:是将企业范围内的全体数据集成到一个数据仓库中,用户可以方便地从中进行信息查询、产生报表和进行数据分析等。数据仓库是一个决策支撑环境,它从不同的数据源得到数据,组织数据,使得数据有效地支持企业决策。总之,数据仓库是数据管理和数据分析的技术。
 
数据仓库的成功实现能为一个企业带来的主要好处是:
①提高公司决策能力 ②竞争优势 ③潜在的高投资回报

开发和管理一个数据仓库常出现的问题有:低估数据装载工作、源系统隐藏的问题、从现存的数据源捕捉不到的数据、终端用户的需求不断增长、数据差异被忽略、对资源过高需求、数据的所有权问题、高维护性和集成的复杂性。

数据仓库的结构:数据源、装载管理器、数据仓库管理器、查询管理器、详细数据、轻度和高度汇总的数据、归档/备份数据、元数据和终端用户访问工具。

数据仓库的目的是为公司决策者作出战略决策提供信息。这些用户用终端用户访问工具与仓库打交道。有五类访问工具:报表和查询工具、应用程序开发工具、执行信息系统(EIS)工具、联机分析处理(OLAP)工具、数据挖掘工具。此处的执行信息系统工具,又称每个人的信息系统的工具,是一种提供给个人的可按自己风格裁剪系统的所有层次(数据管理、数据分析、决策)的支持工具。

数据仓库主要对五种信息流进行管理:入流(inflow)、上流(upflow)、下流(downflow)、出流(outflow)和元流(metaflow)。
  入流:源数据的析取、纯化和装载。
  上流:通过对数据汇总、包装和分配增加数据到数据仓库中(增加各级汇总数据)。
  下流:存档和备份或恢复仓库中的数据。
  出流:使终端用户可以使用数据。
  元流:处理元数据。
 
数据仓库的工具和技术:析取、纯化和变换工具,数据仓库DBMS,数据仓库元数据和管理工具。

数据仓库管理工具必须能支持的任务:监督来自于多个源的数据装载,数据质量和完整性检查,管理和更新元数据,监督数据库性能以确保高效的查询响应时间和资源利用,统计数据仓库的使用并提供用户费用信息,复制数据同时构造数据子集和分配数据,维护有效的数据存储管理,净化数据,归档和备份数据,实现从故障中恢复和安全管理。

数据仓库的设计过程主要有:
(1)提取数据特征;(2)设计星状模式;(3)设计雪花状模式;(4)设计星片状模式 

本文标签:四川自考 串讲笔记 自学考试互联网数据库1-11章问答资料

转载请注明:文章转载自(http://www.sczk.sc.cn

本文地址:http://www.sczk.sc.cn/zl/3795.html


《四川自考网》免责声明:

(一)由于考试政策等各方面情况的不断调整与变化,本网站所提供的考试信息仅供参考,请以省考试院及院校官方发布公布的正式信息为准。

(二)本站文章内容信息来源出处标注为其他平台的稿件均为转载稿,免费转载出于非商业性学习目的,版权归原作者所有。如您对内容、版权等问题存在异议请与本站联系,我们会及时进行处理解决。联系邮箱:812379481@qq.com

nav

自学考试互联网数据库1-11章问答资料

编辑:四川自考网 日期:2018-05-23 阅读:
课程购买

《自考课程》名师讲解,轻松易懂,助您轻松上岸!低至39.9元/科!

§1
1.数据库技术是随着数据管理的需要而产生的。数据处理的的核心是数据管理。数据管理指的是对数据的分类、组织、编码、储存、检索和维护。

2.数据管理技术共经历了三个阶段:
人工管理阶段、文件系统阶段、数据库系统阶段

3. 人工管理阶段:
数据不保存、数据需要由应用程序自己进行管理、
基本上没有文件概念、数据不共享

4.文件系统阶段:
  数据可以长期保存、文件系统管理数据、
文件已经多样化、数据的存取基本上以记录为单位。
  缺点有:数据共享性差,数据冗余度大;数据和程序缺乏独立性

5.数据库管理阶段:
(1)数据结构化。
(2)数据共享性高、冗余度小、易扩充。
(3)数据独立性高。
 (4)统一的数据管理和控制:数据的安全性保护、数据的完整性控制、数据库恢复和并发控制。
(5)数据的最小存取单位是数据项。
DB:数据库(Database),DB是统一管理的相关数据的集合。
DBMS:数据库管理系统(Database Management System),DBMS是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。
DBS:数据库系统(Database System),DBS是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。
数据库技术:是一门研究数据库结构、存储、管理和使用的软件学科。
第一代数据库系统,即层次数据库系统和网状数据库系统
第二代数据库系统,即关系数据库系统
第三代数据库系统,即面向对象数据库系统 
数据库学科的研究范围:数据库管理系统软件的研制; 数据库设计;  数据库理论

数据模型是现实世界数据特征的抽象。是数据库系统的核心和基础。 
数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。
根据模型应用目的分为:⑴概念模型,也称信息模型,它是按用户的观点对数据和信息建模。⑵数据模型,主要包括层次模型、网状模型、关系模型和面向对象数据模型,它是按计算机系统的观点对数据建模。

数据模型三个要素: 
⑴数据结构  描述系统的静态特性
⑵数据操作  描述系统的动态特性
⑶数据的约束条件  是一组完整性规则的集合
概念模型
数据描述的三个领域:现实世界、信息世界和机器世界
 
数据描述的两种形式:物理描述和逻辑描述。前者是指数据在存储设备上的存取方式,后者是指程序员或用户以用以操作的数据形式。
两个实体型之间的联系可以分为三类:
一对一联系(1∶1);一对多联系(1∶n);多对多联系(m∶n)
E-R图提供了表示实体型、属性和联系的方法。实体-联系方法(E-R方法)是抽象和描述现实世界的有力工具。
 实体型:用矩形表示,矩形框内写明实体名。
 属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。
 联系:用菱形表示,菱形框内写明联系名,并用无向边分别志有关实体连接起来,同时在无向边旁标上联系的类型(1∶1,1∶n或m∶n)。
 

数据模型
数据模型:  层次模型、网状模型、关系模型和面向对象数据模型。
其中层次模型和网状模型统称为非关系模型。
层次模型:用树型结构表示实体间联系的数据模型
层次模型有以下两个限制:
⑴只有一个结点没有双亲结点,称之为根结点;
⑵根以外的其他结点有且只有一个双亲结点。
层次数据模型可以直接表示一对多(包括一对一)的联系;
层次模型表示多对多联系,必须首先将其分解成一对多联系。分解方法有两种:冗余结点法和虚拟结点法。
网状模型:用有向图结构表示实体类型及实体间联系的数据模型。
(1)允许一个以上的结点无双亲;(2)一个结点可以有多于一个的双亲。
关系模型:是由若干个关系模式组成的集合,其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。
关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项,也就是说,不允许表中还有表。
数据系统的三级模式结构:外模式(物理模式)、模式(逻辑模式)和内模式
 
两级映象:
外模式/模式映象  一般在外模式中描述。
模式/内模式映象  一般在内模式中描述。
两层映象保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
数据库管理系统的功能: 
⑴数据定义
⑵数据操纵
⑶数据库运行管理
⑷数据组织、存储和管理
⑸数据库的建立和维护
⑹数据通信接口
数据库管理系统组成:
⑴数据定义语言及其翻译处理程序 
⑵数据操纵语言及其编译(或解释)程序
⑶数据库运行控制程序
⑷实用程序
一个设计优良的DBMS:
⑴友好的用户界面
⑵比较完备的功能
⑶较高的运行效率
⑷清晰的系统结构和开放性

§2
关系数据库系统与非关系数据库系统的区别是,关系系统只有"表"这一种数据结构;而非关系数据库系统还有其他数据结构,对这些数据结构有其他的操作。
关系模型的组成:关系数据结构、关系操作集合、关系完整性约束
关系数据语言 
关系代数语言 例如ISBL
 
元组关系演算语言 例如ALPHA,QUEL
关系演算语言
域关系演算语言 例如QBE
具有关系代数和关系演算双重特点的语言 例如SQL

关系的三类完整性约束:实体完整性、参照完整性和用户定义的完整性

实体完整性规则:要求关系中组成主键的属性上不能有空值。
参照完整性规则:要求不引用不存在的实体。
用户定义完整性规则:由具体应用环境决定,系统提供定义和检验这类完整性的机制。

关系数据语言的共同特点是:语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。

基本关系具有以下六条性质:
①列是同质的(Homogeneous),即每一列中的分量同一类型的数据,来自同一个域。②不同的列可出自同一个域,称其中的每列为一个属性,不同的属性要给予不同的属性名。
③列的顺序无所谓,即列的次序可以任意交换。
④任意两个元组不能完全相同。
⑤行的顺序无所谓,即行的次序可以任意交换。
⑥分量必须取原子值,即每一个分量都必须是不可分的数据项。
  关系模型要求关系必须是规范化的,即要求关系模式必须满足一定的规范条件。这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。

关系是关系模式在某一个时刻的状态或内容。关系模式是静态的,稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。但在实际当中,人们常常把关系模式和关系都称为关系。

实体完整性规则说明如下:
(1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一  个实体集。例如学生关系对应于学生的集合。
(2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。
(3)相应地,关系模型中以主码作为唯一性标识。
(4)主码中的属性即主属性不能取空值。所谓空值就是"不知道"或"无意义"的值。
关系可以有三种类型:基本关系(通常又称为基本表或基表)、查询表和视图表
元组变量主要有两方面的用途:
  ①简化关系名。
  ②操作条件中使用量词时必须用元组变量。

§3
SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体。
特点包括:①综合统一、②高度非过程化、③面向集合的操作方式、④以同一种语法结构提供两种使用方式、⑤语言简洁,易学易用。
定义和合理地使用视图能带来的好处为:
  ⑴、视图能够简化用户的操作
  ⑵、视图使用户能以多种角度看待同一数据
  ⑶、视图对重构数据库提供了一定程度的逻辑独立性
  ⑷、视图能够对机密数据提供安全保护
  视图更新操作规则的限制:
如果视图是从多个基本表使用联接操作导出的,则不允许更新。
如果导出的视图使用了分组和聚合操作,也不允许更新。
如果视图是从单个基本表使用选择和投影操作导出的,并且包括了基本表的主键或某个候选键,则可以执行操作。

SQL中数据控制功能包括事务管理功能和数据保护功能,即数据库的恢复、并发控制;数据库的安全性和完整性。

§4
数据依赖是通过一个关系中属性间值的相等与否体现出来的数据间的相互关系,是现实世界属性间相互联系的抽象,是数据内在的性质,是语义的体现。现在人们已经提出了许多种类型的数据依赖,其中最重要的是函数依赖和多值依赖。
  关系模式规范化时一般应遵循以下原则:
  (1)关系模式进行无损连接分解。
(2)合理选择规范化程度。
  (3)正确性与可实现性原则。
关系模式规范化的基本步骤如图所示。
  ①对1NF关系进行投影,消除原关系中非主属性对码的函数依赖,将1NF关系转换为若干个2NF关系。
  ②对2NF关系进行投影,消除原关系中非主属性对码的传递函数依赖,从而产生一组3NF关系。
  ③对3NF关系进行投影,消除原关系中主属性对码的部分函数依赖和传递函数依赖(也就是说,使决定属性都成为投影的候选码),得到一组BCNF关系。
消除决定属性集非码的非平凡函数依赖 
1NF
 
消除非主属性对码的部分函数依赖
2NF
 
消除非主属性对码的传递函数依赖
3NF
 
消除主属性对码的部分和传递函数依赖
BCNF
 
消除非平凡且非函数依赖的多值依赖
4NF
 
消除不是由候选码所蕴含的连接依赖
5NF
以上三步也可以合并为一步:对原关系进行投影,消除决定属性不是候选码的任何函数依赖。
  ④对BCNF关系进行投影,消除原关系中非平凡且非函数依赖的多值依赖,从而产生一组4NF关系。
  ⑤对4NF关系进行投影,消除原关系中不是由候选码所蕴含的连接依赖,即可得到一组5NF关系。
  5NF是最终范式。
1NF/2NF/3NF存在的问题: ①插入异常 ②删除异常 ③数据冗余度大 ④修改复杂
BCNF问题:①数据冗余度大  ②增加操作复杂  ③删除操作复杂  ④修改操作复杂 
关系模式分解的三个定义(判断对关系模式的一个分解是否与原关系模式等价可以有三种不同的标准):
  (1)分解具有"无损连接性"。
  (2)分解要"保持函数依赖"。
  (3)分解既要"保持函数依赖",又要具有"无损连接性"。
规范化理论提供了一套完整的模式分解算法,按照这套算法可以做到:
①若要求分解具有无损连接性,那么模式分解一定能够达到4NF。
②若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF。
③若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNF

BCNF的关系模式都具有如下3个性质:
  ①所有非主属性都完全函数依赖于每个候选码。
  ②所有主属性都完全函数依赖于每个不包含它的候选码。
  ③没有任何属性完全函数依赖于非码的任何一组属性。

§5
数据库的被破坏主要有以下几个方面:
  (1)系统的软、硬件故障,造成数据被破坏。
  (2)数据库的并发操作引起数据的不一致性。
  (3)自然的或人为的破坏。
  (4)对数据库数据的更新操作有误。
  针对上述问题,数据库管理系统提供相应的功能:
  (1)数据库恢复:在系统失效后的数据库恢复,配合定时备份数据库,使数据库不丢失数据。
  (2)并发控制:保证多用户能共享数据库,并维护数据的一致性。
  (3)安全性保护:防止对数据库的非法使用,以避免数据的泄露、纂改或破坏。
  (4)完整性保护:保证数据的正确性和一致性。

数据库安全控制的一般方法:
①用户标识和鉴定;②存取控制;③定义视图;④审计;⑤数据加密。

数据库的安全性主要是指保护数据库,防止由于非法使用数据库造成数据泄露、更改或破坏。数据库的完整性:数据的正确性、一致性和相容性。
数据的完整性与安全性是数据库保护的两个不同的方面。安全性是防止用户非法使用数据库。完整性则是防止合法用户使用数据库时向数据库中加入不合语义的数据。
事务:并发控制的单位,是用户定义的一组数据库操作序列。
特征:原子性、一致性、隔离性、持久性。


  并发控制的主要技术是采用封锁机制。封锁就是事务T可以向系统发出请求,对某个数据对象(最常用的是记录)加锁。于是事务T对这个数据对象就有一定的控制。基本的封锁类型有两种:排它锁(X锁)和共享锁(S锁)。

和操作系统一样,封锁的方法可能引起活锁和死锁。
活锁是指当若干事务要对同一数据项加锁时,造成一些事务的永远等待,得不到控制权的现象;死锁是指两个以上事务集合中的每个事务都在等待加锁当前已被另一事务加锁的数据项,从而造成相互等待的现象。

数据库中解决死锁的常用方法有:
  ⑴、要求每个事务一次就将所有要使用的数据全部加锁,否则就不能执行。
  ⑵、采用按序加锁法。
  ⑶、不采取任何措施来预防死锁的发生,而是周期性的检查系统中是否有死锁。

可串行化的调度:如果几个事务并行(交错)执行的结果和按次序串行执行的结果相同,则称该并行执行结果是正确的。这样的调度称为可串行化的调度。

两段锁协议是指所有事务必须分两个阶段对数据库项加锁和解锁。
两段锁协议规定所有的事务应遵守下列规则:
  ⑴、在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁。
  ⑵、在释放一个封锁之后,事务再获得任何其他封锁。
  所谓“两段”锁含义是:事务分为两个阶段。第一阶段是获得封锁,也称为扩展阶段。在该阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁。第二阶段是释放封锁,也称为收缩阶段。在该阶段,事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。
数据库系统故障可分为:事务内部的故障、系统故障、介质故障、计算机病毒。

转储:静态转储(转储期间不允许对数据库进行任何存取、修改活动)
  动态转储(转储期间允许对数据进行存取或修改)
  海量转储(每次转储全部数据库)
  增量转储(每次只转储上次转储后更新过的数据)
日志文件是用来记录对数据库每一次更新活动的文件。在转储中必须建立日志文件,后援副本和日志文件综合起来才能有效地恢复数据库。

利用日志文件恢复事务的过程:
①从头扫描日志文件,找出哪些事务在故障发生时已经结束,哪些事务尚未结束;
②对尚未结束的事务进行撤销处理,对已经结束的事务进行重做处理。


①硬件故障;病毒破坏:当数据库本身被破坏时,可重装转储数据库的后备副本,然后运行日志文件,执行事务恢复,这样就可以重建数据库。
②发生事务故障;系统故障:当数据库本身没被破坏,但内容已经不可靠时,可利用日志文件恢复事务,从而使数据库回到某一正确状态,这时不必重装后备副本。

§6
信息系统是提供信息、辅助人们对环境进行控制和进行决策的系统。数据库是信息系统的核心和基础。
 数据库设计内容:结构(数据)设计;行为(处理)设计。
数据库设计分为以下六个阶段:①需求分析阶段、②概念结构设计阶段、③逻辑结构设计阶段、④数据库物理设计阶段、⑤数据库实施阶段、⑥数据库运行和维护阶段。
数据库设计过程中注意的问题:
  (1)数据库设计过程中要充分调动用户的积极性。
  (2)应用环境的改变、新技术的出现等都会导致应用需求的变化,因此在设计数据库时必须充分考虑到系统的可扩性。
  (3)在设计数据库应用的过程中,必须充分考虑到已有应用,尽量使用户能够平稳地从旧系统迁移到新系统。

调查的重点是"数据"和"处理",通过调查、收集与分析,获得用户对数据库的要求:
  (1)信息要求。指用户需要从数据库中获得信息的内容与性质。由信息要求可以导出数据要求,即在数据库中需要存储哪些数据。
  (2)处理要求。指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理。
  (3)安全性与完整性要求。
数据字典:是系统中各类数据描述的集合,是进行详细的数据收集和数据分析所获得的主要成果。
数据字典包括:数据项、数据结构、数据流、数据存储、处理过程。
数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。

在需求分析阶段需要注意的是:
  (1)需求分析阶段的一个重要而困难的任务是收集将来应用所涉及的数据,设计人员应充分考虑到可能的扩充和改变,使设计易于更改,系统易于扩充,这是第一点。
  (2)必须强调用户的参与,这是数据库应用系统设计的特点。数据库应用系统和广泛的用户有密切的联系。因此用户的参与是数据库设计不可分割的一部分。在数据分析阶段,任何调查研究没有用户的积极参加是寸步难行的。设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果承担共同的责任。

概念结构的主要特点是:
  (1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。
  (2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。
  (3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。
  (4)易于向关系、网状、层次等各种数据模型转换。
设计概念结构通常有四类方法:
 自顶向下、自底向上、逐步扩张、混合策略。
实际上实体与属性是相对而言的,实体与属性之间并没有形式上可以截然划分的界限,但可以给出两条准则:
  (1)作为"属性",不能再具有需要描述的性质。"属性"必须是不可分的数据项,不能包含其他属性。
  (2)"属性"不能与其他实体具有联系,即E-R图中所表示的联系是实体之间的联系。
  凡满足上述两条准则的事物,一般均可作为属性对待。

关系数据模型的优化通常以规范化理论为指导,方法如下。
①、确定数据依赖。
②、对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。
③、按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多值依赖等,确定各关系模式分别属于第几范式。
④、按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行合并或分解。

数据库的物理结构依赖于所选用的DBMS,依赖于计算机硬件环境,设计人员进行设计时主要需要考虑以下几个方面:
确定数据的存储结构、设计数据的存取路径、确定数据的存放位置、确定系统配置。

数据库实施主要包括以下工作:
 ①、定义数据库结构
 ②、数据装载
③、编制与调试应用程序
④、数据库试运行
数据库维护工作主要内容:
  ①、数据库的转储和恢复
  ②、数据库的安全性、完整性控制
  ③、数据库性能的监督、分析和改进
  ④、数据库的重组织和重构造
 
§7
URL组成:
检索协议、Internet节点、为HTTP客户服务的资源文件名。

CGI是外部应用程序(CGI程序)与Web服务器之间的接口标准,是在CGI程序和Web服务器之间传递信息的规程。CGI规范允许Web服务器执行外部程序,并将它们的输出发送给Web浏览器。CGI将Web的一组简单的静态超媒体文档变成一个完整的新的交互式媒体。
CGI程序调用方式:
①通过交互式主页里的表单栏(FORM)调用CG1程序,用户在填完一张表单后,按确认按钮就启动了CGI程序。
②通过URL直接调用CGI程序。

CGI的主要优点是它的简单、语言无关性、Web服务器无关性以及它广泛的可接受性。
虽然CGI提供了一种与数据库连接的简单方法,但它也存在一些局限性。
⑴瓶颈问题,客户机和数据库服务器之间的通信必须通过Web服务器,当有大量的用户访问时,Web服务器会"超载"。
⑵缺乏效率和事务支持,CGI应用程序不能由多个客户机请求共享,降低了性能,增加了等待时间。
⑶CGI应用程序不持久,服务器必须为每次访问CGI程序建立新的进程或线程,每次请求时数据库连接都必须重新打开,开销很大。
⑷CGI程序安全性问题

ASP文件组成部分:
(1)文本;
(2)HTML标记,可单独使用或嵌入在各个ASP脚本单元中,以" <和>"为定界符;
(3)VBScript(或JScript)语句,可单独使用或嵌入在各个ASP脚本单元中,以(SCRIPT和/SCRIPT)为定界符,通过对"RUN AT"属性的设置来决定是否在服务器端运行;
(4)ASP脚本命令:可单独使用或包含在此和〈/html〉内,以"〈%"和"%〉"为定界符。

API是驻留在Web服务器上的程序代码,它扩展了服务器的性能,其方式类似于CGI。
ActiveX是Microsoft提出的一种标准,AcitveX也是Microsoft一组软件技术的统称,包括控件、文档、脚本三种最常用的技术,以及Microsoft的许多其他技术。
Active Server Pages(ASP)是 Microsoft基于服务器的、建立动态和交互式 Web页面的技术,它是建立在ISAPI技术基础上的,并克服了CGI存在的缺点。
ADO包括七个对象:三个主对象为连接对象、命令对象、记录集对象。错误对象、字段对象、参数对象、属性对象

§8
JDBC是执行SQL语句的Java API。JDBC即“Java Database Connectivity”(Java数据库连接),它由一组用Java语言编写的类与接口组成,已成为一种数据库连接的标准。
JDBC与ODBC以及其他API的区别:① Java不能直接使用ODBC,因为是ODBC使用C语言接口,如果让Java来调用本机C代码,将会在安全、属性、健壮性、应用的可移植性等方面带来困难。②不希望把ODBC API逐字地翻译成Java API,例如ODBC使用了大量易出错地指针,而Java取消了这种不安全地指针。③ODBC难以学习,它把简单功能和高级功能混杂在一起,即便是简单的查询语句也会带来复杂的任选项。而JDBC的设计使得简单的事情用简单的方法做,仅在必要时才让用户使用高级功能。④JDBC的Java API提供“纯Java”的解决方法。当使用ODBC时,ODBC驱动器管理程序与驱动器必须手动地装入到每台客户机上。而JDBC驱动器全是用Java编写的,ODBC代码可在所有Java平台上自动安装,并且是可移植的和安全的。

JDBC的特点:JDBC是低级的API,是高级API的基础。JDBC是一种低级的接口,它直接调用SQL命令,但又可以作为构造高级接口和工具的基础。在执行时,高级API将首先被翻译成如JDBC这样的低级接口。
JDBC的基本功能包括:建立与数据库的连接、发送SQL语句、处理结果。

JDBC提供了连接数据库的几种方法:
①与数据源直接通信;②通过JDBC驱动程序的通信;③与ODBC数据源通信
利用JDBC访问数据库的Java应用程序有两种:一种是本身就有数据访问功能的Java程序,另一种是使用JDBC做媒介的Java应用程序

JDBC API提供的类或接口主要包括:
Java.sql.DriverManager 处理驱动程序的装载和建立新的数据库连接。
Java.sql.Connection 完成对某一指定数据库的连接。
Java.sql.Statement 管理在一指定数据库连接上的SQL语句的执行。
Java.sql.ResultSet 从数据库返回的结果集。
客户端的Java应用程序需要完成的工作有:
  1)与JDBC服务器建立连接;
  2) 装载JDBC/ODBC驱动器;
  3)与ODBC数据源建立连接;
  4)发送SQL语句;
  5)得到查询结果;
  6)关闭与JDBC服务器的连接。

编写用JDBC编写能实现数据库连接和断开的程序段:
import java.net.URL;
import java.sq1.*import java.net.URL;
import Java.sq1.*
class jdbc_connect
{
public static void main(String argv[])
{
if(argv.length==0)
{
System.err.println(“检查到空的URL!”); System.exit(1);
}∥end of if
try
{
Class.forName(“textFileDriver”);
Class.forName(“jdbc.odbc.JdbcOdbcDriver”);
Class.forName(“imaginary.sq1.iMsq1Driver”);
String ur1=argv[0];
String user,pwd;
If(argv.length>1)
{
user=argv[1];
}
else
{
user=”” }
If(argv.length>2)
{
pwd=argv[2];
}
else
{
pwd=”” }
Connection con=DriverManager.getConnectiion(ur1,user,pwd);
Con.close();
System.out.println(“连接失败!”); }∥end of try
∥处理连接异常 catch(Exception e)
{
System.out.println(e.getMessage());
e.printStackTrace();
}
}∥end of main
}∥end of class

§9
Active Server Pages(简称ASP)是服务器端脚本环境,所用的语言是Javascript或VBscript,或者是它们两者的结合。
ASP的主要特点如下:
  ①使用VBScript、Jscript等简单易懂的脚本语言,结合HTML代码,即可快速地完成网站的应用程序。
  ②无须编译,容易编写,在服务器端直接执行。
  ③使用普通的文本编辑器即可进行编辑设计。
  ④与浏览器无关,用户端只要使用可执行HTML码的浏览器,即可浏览ASP所设计的网页内容。
  ⑤ASP的源程序不会被传到客户浏览器,因而可以避免所写的源程序被他人剽窃,从而提高了程序的安全性。
  ⑥可使用服务器端的脚本来产生客户端的脚本。

Active Data Object(ADO)是一项容易使用并且可扩展的将数据库访问添加到Web页的技术。
ADO所有重要的接口:
①Connection(连接)  ②Error(错误集)  ③Command(命令)
④Parameter(参数)  ⑤Recordset(游标)  ⑥Field(字段)

创建一个Connection接口通常是调用server对象的CreateObject方法:
  Set myConnection=Server.CreateObject("ADODB.Connection")
(a)直接将连接字符串传给Open方法
 
  (b)利用它的ConnectionString属性
 
ConnectionString的参数  作用
DSN  为数据源名(不可省)
PWD  访问数据源的口令
UID  访问数据源的用户帐号
Provider  为数据提供者
File Name  指定数据源的某个特定的文件

Close方法

  这样,就释放了所有的资源,因此如果想再利用Connection对象,只能重新创建一个了。
创建Command对象:
 

§11
面向对象数据库系统(Object Oriented Data Base System,简称OODBS)是数据库技术与面向对象程序设计方法相结合的产物。
对于OO数据模型(面向对象数据模型)和面向对象数据库系统的研究主要体现在:研究以关系数据库和SQL为基础的扩展关系模型;以面向对象的程序设计语言为基础,研究持久的程序设计语言,支持OO模型;建立新的面向对象数据库系统,支持OO数据模型。


对象-关系数据库系统特点:
(1)扩充数据类型,(2)支持复杂对象,(3)支持继承的概念
(4)提供通用的规则系统

分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力(称为场地自治),可以执行局部应用。同时,每个结点也能通过网络通信子系统执行全局应用。

分布式数据库系统是在集中式数据库系统技术的基础上发展起来的,它的特点:
  一、数据独立性。在分布式数据库中,除了数据的逻辑独立性与物理独立性(集中式数据库特点)外,还有数据分布独立性亦称分布透明性。
  二、集中与自治相结合的控制结构。
  三、适当增加数据冗余度。
  四、全局的一致性、可串行性和可恢复性。
分布式数据库系统的目标,主要包括技术和组织两方面的目标:
  1、适应部门分布的组织结构,降低费用。
  2、提高系统的可靠性和可用性。
  3、充分利用数据库资源,提高现有集中式数据库的利用率。
  4、逐步扩展处理能力和系统规模。

并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。
一个并行数据库系统应该实现如下目标:
1、高性能;2、高可用性; 3、可扩充性

并行数据库系统结构:共享内存(主存储器)结构(SM结构),共享磁盘结构(SD结构)和无共享资源结构(SN结构)。

多媒体数据库是多媒体技术与数据库技术相结合产生的一种新型的数据库。
所谓多媒体数据库是指数据库中的信息不仅涉及各种数字、字符等格式化的表达形式,而且还包括多媒体的非格式化的表达形式,数据管理要涉及各种复杂对象的处理。
在建立多媒体应用环境时必须考虑的问题:
确定存储介质、确定数据传输方式、确定数据管理方式和数据资源的管理。

多媒体数据库与传统的数据库有较大的差别,主要表现在:
  (1)处理的数据对象、数据类型、数据结构、数据模型和应用对象都不同,处理的方式也不同。
  (2)多媒体数据库存储和处理复杂对象,其存储技术需要增加新的处理功能,如数据压缩和解压。
  (3)多媒体数据库面向应用,没有单一的数据模型适应所有情况,随应用领域和对象而建立相应的数据模型。
  (4)多媒体数据库强调媒体独立性,用户应最大限度地忽略各媒体间的差别而实现对多种媒体数据的管理和操作。
  (5)多媒体数据库强调对象的物理表现和交互方式,强调终端用户界面的灵活性和多样性。
  (6)多媒体数据库具有更强的对象访问手段,比如特征访问、浏览访问、近似性查询等。


多媒体的建模方法有多种,常见的有以下几种方法:
(1)扩充关系模型 (2)语义模型(3)对象模型
多媒体数据库管理系统(MDBMS)能实现多媒体数据库的建立、操作、控制、管理和维护,能将声音、图像、文本等各种复杂对象结合在一起,并提供各种方式检索、观察和组合多媒体数据,实现多媒体数据共享。 多媒体数据库管理系统的基本功能应包括如下几点:
  (1)能表示和处理复杂多媒体数据,并能较准确地反映和管理各种媒体数据的特性和各种媒体数据之间的空间或时间的关联,能为用户提供定义新的数据类型和相应操作的能力。
  (2)能保证多媒体数据库的物理数据独立性、逻辑数据独立性和多媒体数据独立性。
  (3)提供功能更强大的数据操纵,比如非格式化数据的查询、浏览功能,对非格式化数据的一些新操作,图像的覆盖、嵌入、裁剪,声音的合成、调试等。
  (4)提供网络上分布数据功能,对分布于网络不同结点的多媒体数据的一致性、安全性、并发性进行管理。
  (5)提供系统开放功能,提供多媒体数据库的应用程序接口(API)。
  (6)提供事务和版本的管理功能。

数据仓库的定义是:在支持管理的决策生成过程中,一个面向主题的、集成的、时变的、非易失的数据集合。
数据仓库的最终目的:是将企业范围内的全体数据集成到一个数据仓库中,用户可以方便地从中进行信息查询、产生报表和进行数据分析等。数据仓库是一个决策支撑环境,它从不同的数据源得到数据,组织数据,使得数据有效地支持企业决策。总之,数据仓库是数据管理和数据分析的技术。
 
数据仓库的成功实现能为一个企业带来的主要好处是:
①提高公司决策能力 ②竞争优势 ③潜在的高投资回报

开发和管理一个数据仓库常出现的问题有:低估数据装载工作、源系统隐藏的问题、从现存的数据源捕捉不到的数据、终端用户的需求不断增长、数据差异被忽略、对资源过高需求、数据的所有权问题、高维护性和集成的复杂性。

数据仓库的结构:数据源、装载管理器、数据仓库管理器、查询管理器、详细数据、轻度和高度汇总的数据、归档/备份数据、元数据和终端用户访问工具。

数据仓库的目的是为公司决策者作出战略决策提供信息。这些用户用终端用户访问工具与仓库打交道。有五类访问工具:报表和查询工具、应用程序开发工具、执行信息系统(EIS)工具、联机分析处理(OLAP)工具、数据挖掘工具。此处的执行信息系统工具,又称每个人的信息系统的工具,是一种提供给个人的可按自己风格裁剪系统的所有层次(数据管理、数据分析、决策)的支持工具。

数据仓库主要对五种信息流进行管理:入流(inflow)、上流(upflow)、下流(downflow)、出流(outflow)和元流(metaflow)。
  入流:源数据的析取、纯化和装载。
  上流:通过对数据汇总、包装和分配增加数据到数据仓库中(增加各级汇总数据)。
  下流:存档和备份或恢复仓库中的数据。
  出流:使终端用户可以使用数据。
  元流:处理元数据。
 
数据仓库的工具和技术:析取、纯化和变换工具,数据仓库DBMS,数据仓库元数据和管理工具。

数据仓库管理工具必须能支持的任务:监督来自于多个源的数据装载,数据质量和完整性检查,管理和更新元数据,监督数据库性能以确保高效的查询响应时间和资源利用,统计数据仓库的使用并提供用户费用信息,复制数据同时构造数据子集和分配数据,维护有效的数据存储管理,净化数据,归档和备份数据,实现从故障中恢复和安全管理。

数据仓库的设计过程主要有:
(1)提取数据特征;(2)设计星状模式;(3)设计雪花状模式;(4)设计星片状模式 

微信扫一扫,进群领取资料!

    微信咨询老师
  • (扫码加入[四川自考交流群])
    历年真题、复习资料、备考方案》,马上领取!
最新真题、复习资料、模拟试题 | 一键领取 >>
【四川自考网声明】:

1、由于各方面情况的调整与变化,本网提供的考试信息仅供参考,考试信息以省考试院及院校官方发布的信息为准。

2、本网信息来源为其他媒体的稿件转载,免费转载出于非商业性学习目的,版权归原作者所有,如有内容与版权问题等请与本站联系。联系邮箱:812379481@qq.com。