《基础地理信息要素数据字典第2、3部分》编制说明
段怡红 吕玉霞 李建利 兀 伟 肖学年 张 坤 马晓萍
(国家测绘局测绘标准化研究所 西安 710054)
摘 要:基础地理信息要素数据字典标准的研究和制定在我国尚属首次。该标准的研究和制定中涉及以下问题:标准研究的内容、基础地理信息要素数据字典的样式、要素名称、属性表和几何表示之间的关系、属性值是否需要赋代码、相关要素及关系,以及1:5 000 1:10 000与1:25 000 1:50 000 1:100 000基础地理信息要素数据字典的差异等。对以上问题进行了详细的说明。
关键词:基础标准;数据字典;基础地理信息数据库
目前,全数字化基础地理信息生产技术体系已经取代了传统的模拟测绘技术体系,并逐步向网络信息化方向发展。数字地图(特别是矢量地图)数据的生产及其数据库建设,是基础地理信息系统及其网络体系建设的基础和关键。本标准的制定,对于指导当前的全数字化基础地理信息系统的建设具有重要的意义。
1 标准研究内容的确定
数据字典是对数据库中数据的描述。根据描述对象的差异,数据字典可以分为以下3种类型。
1)数据库数据字典:对空间数据库整体进行描述,内容主要包括数据的归属、数据源、地图投影、数据的分层、数据质量及数据质量检测部门等。
2)数据集数据字典:对数据库中的数据集进行描述,主要包括数据集中数据的分层和数据命名等。
3)要素数据字典:对数据库数据中所包含的基础地理数据要素进行描述,主要描述要素的概念、要素的几何表示、属性以及相关要素间的相互关系等。
根据对当前国内外大量资料的分析研究,并结合我国基础地理信息数据生产与建库的现状,确定本数据字典的描述对象为基础地理信息要素。
2 主要参考资料及分析
1)ISO/TC211 19126 地理信息 要素属性分类代码数据字典,工作小组草案,2002年9月13日。该标准依据ISO 19110 地理信息 要素编目方法,定义了用于开发要素目录的地理要素和属性的数据字典结构。要素数据字典描述了用于建立要素目录的要素和属性的集合。数据字典的内容不是把属性和要素联系起来,而是应在定义要素目录的时候建立这种联系。数据字典建立的是某一特定领域的所有要素和属性的全域。
该数据字典是指用于产生要素目录的要素类型、要素属性类型、要素属性值和要素类型联系的集合。数据字典通常由元素、属性和属性值组成。典型的数据字典中包含的元素和属性由名称、标记(和/或代码)及相关定义组成,属性还可进一步由数据类型、域约束条件及适用单位组成。
2)加拿大的国家地形数据库(NTDB)数据字典,1996年5月。内容包括实体名称、实体所隶属的专题、实体的定义、实体属性及其值、组合属性值和相应的编码(相当于我国的分类编码)、几何表示规定、尺寸要求、空间表示类型(2维或3维)、不包括高程的平面的图案、关系、图示和附加说明,涉及2个比例尺1:50 000和1:250 000。
3)美国DLG-F数据字典―交通/水文,美国乔治亚大学信息技术开发服务中心于1998年4月25日和1999年3月12日分别开发的“DLG-F数据字典―交通”与“DLG-F数据字典―水文”。内容包括要素的名称、定义、要素分类(几何)、要素采集的层名、要素的属性表以及该要素各属性项的描述和规定,比例尺为1:24 000。
4)全球地图数据字典(矢量)1:1 000 000,全球地图国际指导委员会2000年3月16日发布。内容包括层名、要素名称、要素代码描述、定义、基本类型、属性、字段名、字段类型、字段大小、属性值类型代码和属性值描述或举例。它是由全球地图国际指导委员会制定的,其比例尺为1:1 000 000。
5)GEODATA TOPO-100K Series 1矢量产品、GEODATA TOPO-250K Series 2矢量产品及NTMS系列1:100 000 & 1:250 000地形图产品 澳新土地委员会地形图产品地形数据和地图规范附录A 数据字典,澳大利亚工业、科学及资源部测量和土地信息组2000年9月1日发布的3.5版。内容包括6个部分:
① 要素分类对照参考,要素分类与通常使用的术语的对照;
② 包含术语对照参考,通常使用的术语与要素分类的对照;
③ 要素分类字典,详细给出了有效要素分类的定义、使用条件和其他参考信息;
④ 二级表字典,包括数据质量表、Tile质量信息表、Tile频率表和二级属性表;
⑤ 符号字典,定义了图中使用的符号;
⑥ 层(cover)表字典,给出了每层属性表的定义。
这是一个非常庞杂的数据字典,包括了与我国相对应的分类代码、图式、数据库结构和要素数据字典等多项标准。
6)澳大利亚地学GIS产品数据字典,2002年4月版。内容包括专题要素的口语名称、数字化的名称,该专题要素数据类型的简短描述、几何类型,与该专题要素链接的查询表清单和关于该专题要素的特殊注释等,同时还具体给出了该专题要素的描述表和链接的属性查询表。
7)新西兰地形数据字典(3.2版),新西兰土地信息局的地形和水文局发布,主要用于1:50 000比例尺的数据源。内容包括对象类、实体类、附加实体类、对象遗传、对象描述、地图影像、数据影像、实体来源、分类、标识点类、最后更新日期和版本号。
8)GIS数据字典,美国阿拉斯加MATANUSKA SUSITNA镇信息技术办公室,2003年1月16日。内容包括描述、文件名、文件类型、要素分类、属性、精确度、数据来源、建库过程、输入比例尺、采取的质量控制方法、精度、数据现势性、数据完整性、数据最后更新、维护计划、维护负责机构和元数据最后更新。
9)基础地理信息数据库数据字典规范(国家标准报批稿,1999年10月)。
10)《1:10 000基础地理信息数据生产与建库总体技术纲要》暂行规定之十五《1:10 000基础地理信息数据库数据字典》,国家测绘局,2001年6月。
11)中国可持续发展信息共享数据库数据字典内容标准。
12)全国1:4 000 000地形数据库数据字典。
13)全国1:50 000、1:250 000地形数据库数据字典。
3 基础地理信息要素数据字典样式的确定
通过对以上有关数据字典资料的整理、分析和比较,明确了数据字典的概念。数据字典描述的主要内容都包括要素(或实体)名称、描述(或定义)和属性表,至于其他内容则各国有各自的特色。例如加拿大的国家地形数据库(NTDB)数据字典是2个比例尺对照,而且把属性值组合进行编码,并采用图示表达实体之间的关系;美国DLG-F数据字典―交通/水文、澳大利亚地学GIS产品数据字典和全球地图数据字典(矢量)等,则通过链接的属性表表示地理信息的属性及其值域;新西兰的地形数据字典通过地图影像和对应的关系图展示自己的特色。而我国现有的数据字典均是对整个数据库列项说明有关数据情况。
总之,通过各种分析比较,并结合专家意见,确定了本标准“基础地理信息要素数据字典”的样式。
4 基础地理信息要素数据字典有关问题的说明
4.1 要素名称
要素的正式名称。本数据字典中的要素名称与GB/T XXXX―200X 基础地理信息要素数据分类与代码保持一致。对于GB/T XXXX―200X 基础地理信息要素数据分类与代码中某些子类要素,当其名称单独使用无法保证其唯一性时,采用了在子类要素名称前后增加大、中类名称的方法来完整描述其要素名称。
4.2 属性表及其与几何表示之间的关系
属性表中列出该要素的各种属性名称、属性描述、数据类型和字段要求、属性值域或示例、可选性及备注。
属性值域或示例中,可以通过简单枚举全部列出其属性值的,则列出该属性项可能的全部取值,并在各属性值列项之间用“/”分隔,如水准点的等级,一等/二等/三等/四等;不能通过简单枚举列出其全部属性值的,通过示例加以说明,示例中的属性项取值用“”表示,如河流名称“长江”。
属性的可选性是按照这样一个原则来定义的,即原来地形图上必须表达的内容一律作为必选项,条件选择或其他增加的属性项作为可选项。考虑到国家基础地理信息数据库是为了满足用户的更多需求或专业要求,要素的可选属性项还可扩充。
几何表示中,当要素以点表示时,其所有属性项都挂接在该点上;当要素以线表示时,其所有属性项都挂接在该线上;当要素以面表示时,其所有属性项都挂接在该面上。面状道路由于既要采集面,也要采集中心线,因此其属性项既要挂接在面上,也要挂接在其中心线上。
4.3 属性值是否需要赋代码
国外的一些数据字典对可穷举的属性值都进行了编码,如加拿大和新西兰的数据字典。属性值编码使用起来更方便。我们也曾对属性值进行过编码,但通过意见反馈认为属性值编码后虽然码位缩短,可是要求作业人员记忆的内容增多且容易出错,不如直接的属性清晰明了。当进行数据查询时,属性一目了然,无需再将属性编码转换成相应的属性值,所以属性值直接采用中文表示。
4.4 相关要素及关系
相关要素及关系是地理信息数据库系统必须有的内容,而如何表示和说明这些内容是数据字典标准的重要内容之一,也是数据字典标准应该解决的问题。相关要素及关系表示和说明的准确与否直接影响本标准在基础地理信息数据库建设中的应用和指导价值,进而影响本标准的适用性,同时对基础地理信息数据库建设也会有很大的影响。
4.4.1 数据字典中相关关系的确定
空间关系通常分为3大类:1)拓扑空间关系,用来描述空间实体之间的相邻、包含和相交等空间关系;
2)顺序空间关系,描述空间实体之间在空间上的排列次序,如实体之间的前后、左右和东、南、西、北等方位关系;3)度量空间关系,用于描述空间实体之间的距离等关系。
拓扑空间关系在地理信息系统和空间数据库的研究和应用中具有十分重要的意义。拓扑空间关系的形式化描述是建立在点集拓扑理论基础之上的。
《地理信息系统——原理、方法和应用》一书中指出,根据扩展9交模型中各元素不同取值,可形成大量空间关系,但对其进行归纳和分类,可得出5种基本的空间关系:相离(Disjoint)关系、相接(Touch)关系、相交(Cross)关系、包含于(In)关系和交叠(Overlap)关系,并将这5种关系定义为空间关系的最小集,其特征为:
1)相互之间不能转化;
2)能覆盖所有的空间关系模式;
3)能应用于同维与不同维的集合目标;
4)每一种关系对应于唯一的DE-9IM矩阵;
5)任何其他的DE-9IM关系可以通过这5种基本关系进行表达。
加拿大1996年5月发布的国家地形数据库(NTDB)数据字典对相关要素及关系的描述是,把相关要素的拓扑关系归结为连接和共享2种,并描述了归入这2种关系的原则和方法,使用户可依据此原则判断相关要素的关系。ERSI公司在《Modeling Our World》中,通过参考几何形状和比较几何形状是否相等、包含、在内部、相交、不相交、叠加和相接,表示了各种空间关系。
课题组深入研究了国际上一些数据字典标准和好的空间数据模型对相关要素及关系的表示和说明,同时还研究了国内其他行业数据字典的表示方法,此外也参考了一些关于数据字典的研究成果,总结和提出了本数据字典标准对相关要素关系的描述,即相关要素的关系分为连接、重叠和包含。
对于地理信息系统中所涉及的要素来说,相离和相交关系大量存在,但在建库和生产阶段并不需要对这些关系进行处理,只有在应用地理信息系统进行空间分析时,才会考虑这些关系。而本数据字典中所描述的这3种关系是需要在生产过程中对其进行一定的数据处理,才能保证数据的一致性和正确性,有利于地理信息数据的生产和质量监控。
4.4.2 相关关系描述方式
在确定了数据字典中只描述连接、重叠和包含这3种相关关系后,遇到的另一个难题就是如何描述这些关系,是采用枚举法对每个要素及其相关关系进行一一描述,还是确定一个归入这3种关系的原则。经过对这2种方法在数据字典描述中的具体实践,发现如果用枚举法描述所有相关要素及关系显然是不可能的。因为要素及关系来源于客观世界,而客观世界的要素是极其复杂的,其关系更是错综复杂,因此无法枚举完某一要素的所有相关要素及关系。
因此,本数据字典标准对相关要素的描述是给出一个相关要素的域。鉴于地理信息要素相关的复杂性,这个域可能有遗漏,因此本标准规定这个域是可扩充的。用户可以根据这个域选择有意义的相关要素,舍弃无意义或不存在的相关要素,也可以根据需要扩充和增加域中未列出的相关要素。对于相关要素的关系,因其关系是由实际情况确定的,是可变的,需要用户在使用中确定(例如道路和桥梁的关系可能是连接、包含和重叠)。因此,本标准不指定相关要素之间的具体关系,而是给定一个相关关系的域,这个域中包含连接、包含和重叠3种关系,也给出了归入这3种关系的原则和方法,用户可以根据这些原则和方法确定具体关系。这样既避免了本标准对相关要素和关系无法全部枚举以及对相关要素及关系限制过死而无法扩充的问题,又规范了相关要素关系的描述。
5 1:5 000 1:10 000与1:25 000 1:50 000 1:100 000基础地理信息要素数据字典的差异
基础地理信息要素数据字典在内容上有两方面的差异:不同要素的差异和同一要素表达形式的差异。
不同要素的差异指根据1:25 000 1:50 000 1:100 000基础地理信息数据表达的需要,依据1:5 000 1:10 000基础地理信息要素数据字典进行了要素的删减或合并,如删去了泄洪洞、出水口、探井、钻孔、柱廊、门洞、内部道路、电力线入地口、石垄、乡镇已定界和未定界等60多个要素,对某些要素如油管道、天然气主管道等仅表示其上一级别的要素。因为分类代码标准中的中比例尺范围包括1:5 000~
1:100 000,因此1:5 000 1:10 000基础地理信息要素数据字典中要素的确定基本依据分类代码标准,而1:25 000 1:50 000 1:100 000基础地理信息要素数据字典考虑到该比例尺系列地理信息表达的实际需要,对某些要素进行了删减或合并。
同一要素表达形式的差异指某些要素如地面下窑洞、散热塔及宝塔经塔等,在1:5 000 1:10 000基础地理信息要素数据字典中表达为点或面,在1:25 000 1:50 000 1:100 000中表达为点;而某些要素如固定顺岸码头在1:5 000 1:10 000基础地理信息要素数据字典中表达为线或面,在1:25 000 1:50 000 1:100 000中表达为线。
6 数据源和更新日期属性项选取原则
数据源和数据更新日期是数据库中地理实体的重要属性,如果建库完成后,则涉及更新,那么这2个属性项就是必不可少的。鉴于目前尚处于建库阶段,原则上只对重要且变化比较快的要素如公路、桥梁和铁路添加此属性项。
7 结 语
基础地理信息要素数据字典标准的研究和制定在我国尚属首次。借鉴和参考了大量国际上相关研究成果,在对我国已形成的地理信息数据进行梳理的基础上,归纳定义了地理信息要素数据字典的结构。由于技术难度较大,其中也必然会有不足之处,期望在生产实践中得到检验,并得到反馈,以利于标准的更新。
返回