1、数据(data)是数据库中存储的基本对象,数据不单纯指数字,广义的理解认为数据的种类很多,例如文本(text)、图形(graph)、图像(image)、音频(audio)、视频(video)、学生的档案记录、货物的运输情况等都算是数据。可以将数据定义为:描述事物的符号记录。数据的含义称为数据的语义,数据与其语义是不可分的。

2、数据库(Database,DB)顾名思义,是存放数据的仓库。严格来讲,数据库是长期存放在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度(rudundancy)、较高的数据独立性(data independency)和易扩展性(scalability),并可为多种用户共享。概括的讲,数据库数据具有永久储存、有组织和可共享三个基本特点。

3、数据库管理系统(DataBase Management System,DBMS)是位于用户与操作系统之间的一层数据管理软件。数据库管理系统和操作系统一样是计算机的基础软件,也是一个大型复杂的软件系统。

DBMS包括的功能有以下几个方面

数据定义功能:数据库管理系统提供数据定义语言(Data Definition Language,DDL),用户通过它可以方便地对数据库中的数据对象的组成与结构进行定义。

数据组织、存储与管理:数据库管理系统要分类组织、存储和管理各种数据,包括数据字典、用户数据、数据的存取路径等。要确定以何种文件结构和存取方式在存储级上组织这些数据,如何实现数据之间的联系。数据组织和存储的基本目标是提高存储空间利用率和方便存取,提供多种存取方法(如索引查找、hash查找、顺序查找等)来提高存取效率。

数据操纵功能:数据库管理系统还提供数据操纵语言(Data Manipulation Language,DML),用户可以使用它操纵数据,实现对数据库的基本操作,如查询、插入、删除和修改等。

数据库的事务管理和运行管理:数据库在建立、运用和维护时由数据库管理系统统一管理和控制,以保证事务的正确运行,保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统修复。

数据库的建立和维护功能:数据库的建立和维护功能包括数据库初始数据的输入、转换功能,数据库的转储、恢复功能,数据库的重组织功能和性能监视、分析功能等。这些功能通常是由一些实用程序或管理工具完成的。

其他功能:其他功能包括数据库管理系统与网络中其他软件系统的通信功能,一个数据库管理系统与另一个数据库管理系统或文件系统的数据转换功能,异构数据库之间的互访和互操作功能等。

4、数据库系统(DataBase System,DBS)是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DataBase Administrator,DBA)组成的存储、管理、处理和维护数据的系统。

5、数据管理三个阶段的比较

人工管理阶段文件系统阶段数据库系统阶段
背景应用背景科学计算科学计算、数据管理大规模数据管理
硬件背景无直接存取存储设备磁盘、磁鼓大容量磁盘、磁盘阵列
软件背景没有操作系统有文件系统有数据库管理系统
处理方式批处理联机实时处理、批处理联机实时处理、分布处理、批处理
特点数据库的管理者用户(程序员)文件系统数据库管理系统
数据面向的对象某一应用程序某一应用现实世界(一个部门、企业、跨国组织等)
数据的共享程度无共享、冗余度很大共享性差、冗余度大共享性小、冗余度高
数据的独立性不独立、完全依赖于程序独立性差具有高度的物理独立性和一定的逻辑独立性
数据的结构化无结构记录内有结构、整体无结构数据整体结构化(数据库系统与文件系统的本质区别),用数据模型描述
数据控制能力应用程序自己控制应用程序自己控制由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力

6、数据模型是对现实世界数据特征的抽象,也就是说数据模型是用来描述数据、组织数据和对数据进行操作的。数据模型是数据库系统的核心和基础。

7、数据模型的三个要求和两大类

数据模型应满足三方面的要求:一是能比较真实的模拟现实世界;二是容易为人所理解;三是便以在计算机上实现。

根据模型应用的不同目的,可以将这些模型划分为两大类

第一类概念模型:也称信息模型,它是按照数据的观点来对数据和信息进行建模,主要用于数据库设计。

信息世界中的基本概念:(1)实体(entity)是客观存在并可相互区别的事物。实体既可以是抽象的概念和联系,也可以是具体的人、事、物。

(2)属性(attribute)是实体所具有的某一特性。一个实体可以由若干个属性来刻画。如学生实体可以由学号、姓名、性别等属性组成。

(3)码(key)唯一标识实体的属性集称为码。例如学号是学生实体的码。

(4)实体型(entity type)具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。学生就是一个实体型。

(5)实体集(entity set)同一类型实体的集合。例如全体学生就是一个实体集。

(6)联系(relationship)在现实世界中,事务内部以及事务中间是有联系的,这些联系在信息世界中翻页为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系,实体之间的联系通常是指不同实体集之间的联系。实体之间的联系通常有一对一、一对多、多对多等多种类型。

第二类逻辑模型和物理模型:逻辑模型主要包括层次模型、网状模型、关系模型、面向对象数据模型和对象关系数据模型、半结构化数据模型等。它是按计算机系统的观点对数据建模,主要用于数据库管理系统的实现。物理模型是对数据最底层的抽象,它描述数据在系统内部的表达方式和存取方法,或在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。物理模型的具体实现是数据库管理系统的任务,数据库设计人员要了解和选择物理模型,最终用户则不必考虑物理级的细节。

数据模型通常由数据结构、数据操作和数据的完整性约束条件三部分组成。

(1)数据结构描述数据库的组成对象以及对象之间的联系,是所描述的对象类型的集合,是对系统静态特性的描述。

(2)数据操作是指对数据库中的各种对象(型)的实例(值)允许执行的操作集合,包括操作及有关的操作规则。数据库主要有查询和更新(包括插入、删除、修改)两大类操作。数据操作是对系统动态特性的描述。

(3)数据的完整性约束条件是一组完整性规则。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。数据模型应该反应和规定其必须遵守的基本和通用的完整性约束条件,并且提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。

层次模型:用树形结构来表示各类实体以及实体间的联系。在数据库中定义满足下面两个条件的基本层次联系的集合层为层次模型。有且只有一个节点没有双亲节点,这个节点称为根节点;根以外的其它节点有且只有一个双亲节点。在层次模型中同一双亲的节点称为兄弟节点,没有子女节点的节点称为叶节点。层次模型的优点:数据结构比较简单清晰;层次数据库的查询效率高;层次数据模型提供了良好的完整性支持。缺点:现实世界中有很多联系都是非层次性的,如节点之间多对多的联系,不适合用层次模型表示

网状模型:网状数据模库系统采用网状模型作为数据的组织方式,解决非层次关系。网状数据模型的典型代表是DBTG系统,亦称CODNSYL系统。网状模型需满足以下两点:允许一个以上的节点无双亲,一个节点可以有多于一个的双亲。层次模型中子女节点与双亲节点的联系是唯一的,而在网状模型中这种联系可以不唯一。网状模型的优点:能够更为直接的描述现实世界;具有良好的性能,存取效率高。缺点:结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握;网状模型的DDL,DML复杂并且要嵌入某一高级语言(如COBOL、C)中,用户不容易掌握,不容易使用。由于记录之间的联系是通过存取路径实现的,应用程序在选择路径时必须选择适当的存取路径,因此用户必须了解系统结构的细节,加重了编写应用程序的负担。

关系模型:关系模型是最重要的一种数据模型,关系数据库系统采用关系模型作为数据库的组织方式。关系模型是建立在严格的数学概念的基础上的。

关系模型中的一些术语

关系:一个关系对应通常说的一张表。

元组:表中的一行即为一个元组。

属性:表中的一列即为一个属性,给每一个属性起的名即为属性名。

码:也称为码键。表中得某个属性组,他可以唯一确定一个元组,学号可以唯一确定一个学生,也就成为本关系的码。

域:是一种具有相同数据类型的值的集合。

分量:元组中的一个属性值。

关系模式:对关系的描述,一般表示为 关系名 (属性1,属性2...属性n)关系模型要求关系必须是规范化的,其中最基本的一条就是,关系的每一个分量必须是一个不可分的数据项。

关系术语一般表格的术语
关系名表名
关系模式表头(表格的描述)
关系(一张)二维表
元组记录或行
属性
属性名列名
属性值列值
分量一条记录中的一个列值
非规范关系表中有表(大表中有小表)

关系模式的优点:关系模式与格式化模型不同,它是建立在严格的数学概念的基础上的;关系模型的概念单一;关系模型的存取路径对用户透明,从而具有更高的数据独立性,更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作:缺点:查询效率不如格式化模型;增加了开发数据库管理系统的难度。

8、数据库系统的三级模式机构

模式也称为逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。模式是技术是数据库数据在逻辑上的视图。一个数据库只有一个模式。数据库管理系统提供模式数据定义语言(模式DDL)来严格的定义模式。

外模式也称为子模式或用户模式,它是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是模式的子集,一个数据库可以有多个外模式。每个用户只能看见和访问所对应的外模式中的数据,数据库中的其余数据是不可见的。数据库管理系统提供外模式数据定义语言(外模式DDL)来严格的定义外模式。

内模式也称为存储模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述。是数据在数据库内部的组织方式。

外模式/模式映像:模式描述的是数据的全局逻辑结构,外模式描述的是局部的逻辑结构。当模式改变时(例如增加了新的关系新的属性等)有数据库管理员对各个外模式/模式的映像做相应改变,使外模式保持不变。应宝整理用程序是根据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

模式/内模式映像是唯一的,它定义了数据全局逻辑结构与存储结构之间的对应关系。当数据库的存储结构改变时,有数据库管理员对模式/内模式映像做相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性,简称数据的物理独立性。

更多推荐

数据库的一些基本概念