信息技术期刊浅析数据格式及完整性
发布时间:2014-11-19
摘要:域完整性、实体完整性及参照完整性分别在列、行、表上实施。数据完整性任何时候都可以实施,但对已有数据的表实施数据完整性时,系统要先检查表中的数据是否满足所实施的完整性,只有表中的数据满足了所实施的完整性,数据完整性才能实施成功。
关键词:数据格式 完整性 电子期刊
(1)域完整性:是指一个列的输入有效性,是否允许为空值。强制域完整性的方法有:限制类型(通过设定列的数据类型)、格式(通过CHECK约束和规则)或可能值的范围(通过FOREIGN KEY约束、CHECK约束、DEFAULT定义、NOT NULL定义和规则)。如:学生的考试成绩必须在0~100之间,性别只能是“男”或“女”。
(2)实体完整性:是指保证表中所有的行唯一。实体完整性要求表中的所有行都有一个唯一标识符。这个唯一标识符可能是一列,也可能是几列的组合,称为主键。也就是说,表中的主键在所有行上必须取唯一值。强制实体完整性的方法有:索引、UNIQUE约束、PRIMARY KEY约束或IDENTITY属性。如:student表中sno(学号)的取值必须唯一,它唯一标识了相应记录所代表的学生,学号重复是非法的。学生的姓名不能作为主键,因为完全可能存在两个学生同名同姓的情况。
(3)参照完整性:是指保证主关键字(被引用表)和外部关键字(引用表)之间的参照关系。它涉及两个或两个以上表数据的一致性维护。外键值将引用表中包含此外键的记录和被引用表中主键与外键相匹配的记录关联起来。在输入、更改或删除记录时,参照完整性保持表之间已定义的关系,确保键值在所有表中一致。这样的一致性要求确保不会引用不存在的值,如果键值更改了,那么在整个数据库中,对该键值的所有引用要进行一致的更改。参照完整性是基于外键与主键之间的关系。例如学生学习课程的课程号必须是有效的课程号,score表(成绩表)的外键cno(课程号)将参考course表(课程表)中主键cno(课程号)以实现数据完整性。 对于二维关系型数据库来说,其格式指的是库结构,空间数据库除了属性结构如同二维关系型数据库之外,还含有投影类型、坐标系类型、椭球参数、高程系统、比例尺、图层划分、图元参数等。无论何种数据库,数据格式中还包括元数据的格式。
数据的完整性主要体现在以下几个方面。
(1)数据结构的完整性;成果电子数据结构的完整性是以库结构和图层划分为主要内容,考察完整性依据标准体系中所涉及的相关要求,如数据库与图层文件的划分,每个数据库(用户属性库)字段设置是否符合相应标准规定,包括数据库命名、字段名称、数据类型、数据长度、小数位等。原则上标准体系规定的内容不允许改动,因为这将影响到数据共享应用。对于确需增添的字段,建议另设若干新的数据库,以保证最小冗余为前提容纳所有新增字段,并且必须对新设数据库逐库、逐字段加以说明。
(2)数据内容的完整性;有了数据结构完整性的保障,数据内容的完整性就显得非常重要了。所谓数据内容完整性指的是:①必填项不可或缺,例如关键字数据项、重要数据项内容;②涉及软件系统操作的数据对象不能或缺;③对于一般数据库操作的数据项不应或缺,如有关数据查询、检索、统计、汇总和报表输出等数据项内容;④对于包含软件系统开发的地勘项目,数据内容应当包括源代码、安装程序、文档资料等。当然,① ③可能相互交叉,亦可各自独立。另外,④中电子文档资料至少含有软件系统需求分析报告、软件设计说明书、系统开发总结报告、系统测试分析报告、软件使用手册等五个文档。
总而言之,建立数据库是为了应用,毋庸置疑,数据越完整,其生命力越强。
(3)元数据的完整性;以前,大多数建库人员不太重视元数据的建立,给数据库更新维护、数据应用造成了一定困难。随着网络技术的高速发展,数据共享与交流日益普及,元数据的重要性凸显。有了完整的元数据,数据库就具备了较强的活力。地质信息元数据的完整性涉及到:
①标识信息;②数据质量信息;③空间参照系信息;④内容信息(图层名称、要素类型、属性结构及列表等);⑤分发信息;⑥ 引用信息;⑦负责单位联系信息。