中国测绘地理信息标准网

Surveying,Mapping and Geoinformation Standards of China
关于矢量地形图数据字典的研究
发布日期:2000年01月01日 | 发布者:1 | 浏览次数:1365

吕玉霞 段怡红

(国家测绘局测绘标准化研究所 西安 710054)

摘 要 矢量地形图数据字典是矢量地形图数据库建设的基础。介绍、分析了国内外矢量地形图数据字典标准的现状,并对我国矢量地形图数据字典的编制内容和形式进行了研究、探讨。
关键词 数据字典 属性 要素

    近些年来,随着计算机技术、网络技术及信息获取与处理技术的飞速发展,基础地理信息产业发生了巨大的变化。数字基础地理信息生产技术体系取代了传统的模拟测绘技术体系,并逐步向网络信息化方向转变。数字地形图,特别是矢量数字地形图的生产及其数据库的建设是基础地理信息系统及其网络体系建设的基础和关键。目前,在矢量地形图的生产及其数据库的建设过程中,由于需要采集的数据要素较多,要素之间相互关系比较复杂,加之目前尚没有一套关于矢量地形图数据库数据(特别是关于矢量地形图数据库数据字典)方面的规范发布,从而给数据的生产和建库造成了一定的困难和不便。因此,编制一套切实可行的、科学的数据字典是目前矢量地形图及其数据库生产所面临的最迫切的任务之一。

    数据字典是关于地理实体数据描述信息的集合。矢量地形图数据字典是关于矢量地形图所包含的所有地理实体数据描述信息的集合,它有利于数据库建库的标准化、规范化,同时也有利于基础地理信息系统之间的数据共享和转换。

    目前,各地方在进行矢量数字地形图及其数据库的生产建设时,由于地理空间实体种类较多,信息描述也比较复杂,又没有一个统一的数据字典,对地理实体的描述没有一个统一严格的规定;因而造成数据的不一致,数据的兼容性较差,数据共享困难,严重阻碍了基础地理信息系统及其网络体系的建设。

    我国对矢量地形图数据字典的研究始于20世纪90年代中期,并于本世纪初编制了《1:10 000基础地理信息数据库数据字典》暂行规定。现在看来,该暂行规定已经远远不能满足数据生产和建库的需要,如,其要素的分类过分依赖有关的图式,数据字典对要素的属性以及要素的几何特征描述不足等。目前,有关部门正着手编制新的有关矢量地形图数据的数据字典。本文旨在通过介绍和分析美国、加拿大、澳大利亚以及新西兰等国家矢量地形图数据字典的现状,为我国数据字典的编写方法和内容提供一些有益的参考,同时对我国数据字典的编写进行一些有益的探讨和尝试。

1 国外矢量地形图数据字典情况介绍与分析

1.1 美国DLG-F数据字典情况介绍与分析

1.1.1 美国“DLG-F数据字典—水文”与“DLG-F数据字典—交通”情况介绍

    美国乔治亚大学(University of Georgia)信息技术开发服务中心(Information Technology Outreach Services)于1998年4月25日和1999年3月12日分别开发了“DLG-F数据字典—交通”与“DLG-F数据字典—水文”。这2个数据字典格式上基本一致,即分别利用表格的形式对水文和交通所包含的要素进行了描述。其中,“DLG-F数据字典—水文”分别对以下12个要素进行了描述:水网区、人工渠道、运河/沟渠、封闭线、连接处、湖泊/池塘、管线、水库、海/洋、岸线、溪流/河流、沼泽/湿地。“DLG-F数据字典—交通”则对以下9个要素进行了描述:机场、桥梁、直升机起降场、线路标识、里程碑、铁路、公路段、跑道/停机坪/滑行道、下跨道;另外,该字典还给出了附录 A(由乔治亚DOT指定的线路标识识别码),附录B(乔治亚州桥梁和地下通道类型)。

    在这2个数据字典中,每一要素都以表格的形式对要素的名称、定义、要素分类、层名、属性表和DLG-F属性等项进行了描述和规定。

1.1.2 美国“DLG-F数据字典—水文”要素数据字典样式示例

    这里以“DLG-F数据字典—水文”中的“水库”为例,来说明这2个数据字典关于要素描述的具体内容和样式,如图1所示。

DLG-F要素:

水库

定义:

人工建造的、用于蓄水或蓄积其他液体的水池

要素分类:

层名:

HY_POLY

属性表:

HY_POLY.PAT

DLG-F属性

Arc/Info术语

数据类型

属性范围

定义

要素

FEATURE

字符型25

字符的

DLG-F要素的名称

要素ID

FEATURE_ID

字符型10

字符的

唯一、永久的要素ID

FIPS代码

STATE_FIPS

字符型2

2位整数

包含该要素的FIPS代码

FIPS代码

COUNTY_FIPS

字符型3

3位整数

包含该要素的县FIPS代码

水文单元代码

HUC

字符型8

8位整数

包含该要素的盆地的8位数水文单元代码HUC

名称

NAME

字符型32

字符的

水库的地名

数据源

SOURCE

字符型32

字符的

采集要素的数据源

编辑(者)

EDITOR

字符型32

字符的

完成要素更新的实体

数据源日期

SOURCE_DATE

日期

日期

数据源的日期

要素更新日期

FEAT_MOD_DATE

日期

日期

最后更新要素的日期。

图1 “DLG-F数据字典—水文”中“水库”要素样式示例

1.1.3 美国“DLG-F数据字典—水文”与“DLG-F数据字典—交通”的特点分析

    从以上对这2个数据字典的介绍和样式示例中可以看出,这2个数据字典有如下特点:

    1)要素的名称、定义、要素分类(几何)、层名、属性表以及该要素各属性项的描述和规定构成了这2个数据字典每一要素描述和规定必不可少的内容。

    2)由于不同要素需要表达的属性内容不同;因此,在对每个要素的描述和规定中,其DLG-F的属性内容不尽相同,但每个要素都包含有该要素的名称、识别码、要素类型、州FIPS代码、县FIPS代码、数据源、编辑(者)、数据源日期、要素更新日期等基本属性项。对于要素的每一项属性,又分别从Arc/Info术语、数据类型、属性范围、定义4个方面进行了描述和规定。

    3)对照美国的1:24 000比例尺数字线划图标准(即DLG-F)的水文与交通部分与“DLG-F数据字典—水文”、“DLG-F数据字典—交通”2个数据字典可以发现:2个数据字典中所描述的要素大部分为数字线划图标准相应部分中所包含的要素,但也有个别要素并非数字线划图标准相应部分的要素,如“DLG-F数据字典—水文”中的人工渠道等;同时,这2个数据字典并没有对数字线划图标准相关专题部分所包含的所有要素加以描述。另外,数据字典中关于要素的定义、属性项的规定等与数字线划图标准中的规定基本相同,但数据字典中要素的属性项并没有包含数字线划图标准中相应要素的所有属性项。例如,对于湖泊/池塘要素,数字线划图标准中该要素的属性项包括高程、水文类别、名称、水位、水质特征以及影像更新类别等项;而数据字典中该要素的属性项则不包含高程、水位、水质特征等。关于DLG-F标准与这2个数据字典的关系,还有待于作进一步的探讨。

1.2 加拿大国家地形数据库(NTDB)数据字典情况介绍与分析

1.2.1 加拿大国家地形数据库(NTDB)数据字典内容介绍

    加拿大国家地形数据库(NTDB)数据字典包括NTDB中可能出现的所有实体、实体间的相互关系以及其他有关信息。该数据字典由两部分组成,即实体描述部分和附录表格部分。

    该数据字典的第一部分“实体描述”按照一定的顺序对实体进行了描述。一个实体包括正式的实体名称、实体所隶属的专题、实体的定义、实体属性及其值、属性值的合并和它们相应的编码、几何表示规定、尺寸要求、空间表示类型(2维或3维),不包括高程的平面图案、关系、图示和附加说明。附录部分则以表格形式对国家地形数据库中的实体进行了逐个描述。

1.2.2 加拿大国家地形数据库(NTDB)数据字典实体描述样式示例

    下面以加拿大国家地形数据库(NTDB)数据字典中的实体“桥梁”为例,来说明该数据字典实体描述的具体内容和样式,如图2所示。

     人工要素

01   桥梁  

固定属性

桥梁的结构:

0)一般的/未知的。

1)被覆盖的:桥具有用来保护桥面的像盖子一样的建筑物。

2)可移动表面:可以移动桥的一部分,从而使船只通行。

3)其他:除了“被覆盖的”和“可移动表面”外的其他情况。

可变属性

 

几何表示规定

· 位置明确的

· 位置接近的

 

属性值的合并

 

NTDB

 

1:50 000

 

1:250 000

(点)

(线)

┊┊

(面)

(点)

(线)

┊┊

(面)

一般的/未知的

91

 

2139

 

 

2139

 

被覆盖的

92

 

2140

 

 

 

 

可移动表面

93

 

2141

 

 

 

 

其他

 

94

 

 

2142

 

 

 

 

 

 

几何尺寸的规定  (m)

 

 

1:50 000

 

1:250 000

(点)

(线)

┊┊

(面)

(点)

(线)

┊┊

(面)

范围

 

 

 

 

 

 

宽度

 

0

 

 

0

 

长度

 

5

 

 

5

 

 

 

 

 

02

内部专题

桥梁(线)       共享       不利于航飞

桥梁(线)       共享       限制使用的公路

桥梁(线)       共享       铁路

桥梁(线)       共享       公路

备注: 当公路和铁路由单一的构筑物支撑时,在数据集中,表示为一个以上的“桥梁”,因此,数据集中“桥梁”实体的数目并非总与构筑物的实际数目相一致。

图2 加拿大国家地形数据库(NTDB)数据字典实体描述样式示例

1.2.3 加拿大国家地形数据库数据字典特点及分析

    从以上的介绍中可以看出,加拿大的国家地形数据库数据字典有以下几个特点:

    1)该数据字典由两部分组成,即文字描述部分和实体表格构成的附录部分。文字描述部分对附录部分实体表格中所涉及的主要内容(如固定属性、可变属性、几何表示规定、几何尺寸的规定、属性值的合并、与其他要素的关系以及图示等描述内容)作了详细的说明。文字描述部分实际上就是该数据字典中实体表格部分的应用指南。对读者理解和应用该数据字典起着重要的作用。数据字典的附录部分,则以表格的形式,分别对国家地形数据库中的所有实体、实体间的相互关系以及其他有关信息进行了描述。详细的文字说明加上清楚明了的实体表格,成为该数据字典的第一特色。

    2)对实体(即要素)属性的描述构成了实体表格的重要内容,也是本数据字典对实体描述的第二特色。本数据字典对实体属性的描述分为固定属性和可变属性2个方面,并对属性值的含义作了明确的规定;因此,其对实体属性的描述清楚、明了,很有特点。

    3)该数据字典对一个实体的描述,除了最基本的属性的描述内容外,还对实体的几何类型(点、线、面)、几何表示规定、几何尺寸等实体的几何表示方式作了详细、明确的规定。比如,由图2表格中对“桥梁”实体的描述可以看出,“桥梁”实体是以线(即根据图2中的符号03)来表示的,该实体的几何位置是“明确的”或者“接近的”;并且该实体在1:50 000和1:250 000比例尺图上,长度不小于5 m(宽度任意)。根据这些对实体的几何描述内容,我们对实体的几何表示情况便一清二楚。对实体几何特征的描述构成了该数据字典的又一特色。

    4)该数据字典实现了对实体分别在1:50 000和1:250 000 2种比例尺图上表示的描述,即该数据字典既可用于1:50 000比例尺图,又可用于1:250 000比例尺图。描述方式清楚,成为该数据字典的第四大特色。

    5)利用形象直观的“图示”将本实体与其他实体的关系表现得清楚、明了。

    总之,加拿大国家地形数据库数据字典有很明显的特点,可以为我国矢量地形图数据库数据字典的编制提供一些有益的参考。

1.3 澳大利亚地学GIS产品数据字典情况介绍与分析

1.3.1 澳大利亚地学GIS产品数据字典情况介绍

    2002年4月版《澳大利亚地学GIS产品数据字典》,是澳大利亚地学GIS产品数据字典的最新版本。其内容包括引言、地质专题、地球物理学专题、地球化学与地球年代学专题、矿产储存与矿产潜能评估专题、测量与野外观测专题、城市基础设施专题、自然地理学专题、制图学专题等部分。数据字典的第一部分“引言(或介绍)”,主要介绍了数据字典的基本原理、维护、术语、字段格式、通用规则等,其余各部分则分别对其专题类型所包含的每一要素类型进行了详细的规定。

    该数据字典对每个专题要素的描述主要包括该专题要素的名称、数字化的名称,该专题要素数据类型的简短描述、几何类型,与该专题要素链接的查询表清单,关于该专题要素的特殊注释等,并且还具体给出了该专题要素的描述表和链接的属性查询表。在该专题要素的描述表中,对该专题要素的对象、分类、名称、定义以及该要素的属性一一加以规定;在其链接的属性查询表,又对该专题要素对象各属性项的字段名称、字段类型、字段名的大小写、强制性、有效值以及字段描述及其原则等进行了详细的描述。

1.3.2 澳大利亚地学GIS产品数据字典专题要素描述样式示例

    下面以澳大利亚地学GIS产品数据字典中的城市基础设施专题中的专题要素“铁路”为例,来具体说明该数据字典对专题要素的描述内容和方式,如图3所示。

铁路

名称  铁路

描述  铁路和附属设施

类型  线层

对象

要素分类

要素

要素描述

属性

铁路

铁路

通常由火车使用的路线或交通网

要素(feature、要素唯一识别符(ufi)、名称(name)、类型(type)、双轨道(dual

 

对象

字段名称

字段类型

字盘情况

强制性

有效值

字段描述

原则

要素

feature

12,12,C

大写字母

铁路

要素类型

 

 

要素唯一

识别符

ufi

6,6,I

n/a

小于一百万的正整数

要素唯一识别符(ufi

层中要素类型必须唯一,该层完成时应赋给RECNO计算

 

名称 (name)

64,64,C

大写字母

 

要素名称,如.

尼—纽卡斯尔

 

 

类型

type

16,16,C

大写字母

宽轨、标准、窄轨、其他

根据铁路规格所进行的分类

 

 

双轨道(dual

1,1,C

大写字母

YN

指明要素类型是为双车(Y)或是单车(N)路

 

图3 澳大利亚地学GIS产品数据字典专题要素描述样式示例

1.3.3 澳大利亚地学GIS产品数据字典特点及分析

    从以上的介绍中可以看出,澳大利亚地学GIS产品数据字典有以下几个特点:

    1)从内容上来看,该数据字典主要可以分为两部分,即关于数据字典应用的指南部分(即该文的引言)和各专题要素数据字典的具体描述部分。在数据字典的引言部分,分别对该数据字典的基本原则、维护、术语、字段格式、一般规定、字符字段规定、数字字段规定、要素唯一识别符(ufi)字段编号规定、注释规则、多边形标识规定、GIS分析查询表、标准专题命名规定以及关于各专题要素数据字典阅读的方法等方面一一加以介绍。在各专题要素数据字典的具体描述部分,利用文字对该专题要素的名称、简短描述、类型等加以描述;利用该专题要素的描述表格对该专题要素的对象、分类、名称、定义以及该要素的属性一一加以规定;利用该专题要素对象链接的属性表格,对该专题要素对象各属性项的字段名称、字段类型、字段名的大小写、强制性、有效值以及字段描述及其原则等加以详细地描述。

    2)在对专题要素对象的描述中,将专题要素对象的各属性查询表同该专题要素的描述表相链接,从而使专题要素的描述同其属性的描述浑然一体,方便了数据的查询和使用。

    3)链接的属性查询表成为该专题要素数据字典描述内容的重要组成部分。在链接的属性查询表中,对该专题要素对象的每一属性项,逐一加以描述和规定,从而使要素属性的描述清楚、明了。

1.4 新西兰地形数据数据字典情况介绍与分析

1.4.1 新西兰地形数据数据字典情况介绍

    新西兰地形数据数据字典(3.1版)是由新西兰土地信息局的地形和水文局最近发布的用于GIS地形数据的数据文件。它是在2000年7月的2.2版的基础上修订完成的,主要用于1:50 000比例尺数据源。该数据字典由两部分构成:数据文件指南和以超文本链接标示语言(HTML)格式描述的新西兰地形数据对象、其属性和相关信息的数据库。HTML数据库精确描述了每个对象,包括对象类别、实体数据源、对象渊源(即来历)、分级、相关对象。由于条件所限,笔者未能获得该数据库进一步的详细资料。这里仅对该数据字典指南中介绍的有关信息说明如下:

    1)对象。空间对象是数据库中最基本的数据单元。有3种对象类型:点、线和多边形。在该数据字典中,点对象(Point)以_pnt表示;线对象(Line)分别表示为中心线(_cl)和边线(_edge);多边形对象(Polygon)分别以多边形对象的边界线(_bdy)、多边形对象的面(_poly)和多边形对象的标识点(_seed)来表示。每一对象都包括相关的属性,该属性可以分为描述地理信息和非地理信息2种。

    2)属性数据。属性数据能进一步识别对象类型,支持对象的空间和非空间特性。

    3)实体。实体为不能划分为同一类现象的现实世界现象,是空间数据转换标准(SDTS)FIPSPUB 173所采用的划分对象的方法。新西兰地形数据对象是依据其实体分类的。实体、对象与属性的关系参见图4。

04

图4 实体、对象与属性的关系

    4)新西兰地形数据的有关对象:根据专题主要分为水文对象、地貌对象、公共设施对象、交通对象、非植被土地覆盖对象、建筑对象、植被土地覆盖对象和名称与描述性注记(仅包括3个对象)。新西兰地形数据数据字典指南按照专题逐一列出了该数据字典中所包含的所有对象。

    5)另外,该数据字典指南还对数据的精度、综合的影响、坐标值标准、坐标值规定以及主要术语等进行了介绍。

1.4.2 新西兰地形数据数据字典的特点

    从以上对新西兰地形数据数据字典的介绍,可以看出其主要特点如下:

    1)该数据字典分为相互独立的2个部分,即关于数据字典的数据文件指南和以超文本链接标示语言(HTML)格式描述的新西兰地形数据对象、其属性和相关信息的数据库。特别是在数据字典的数据文件指南中,对涉及数据字典数据描述的大量概念进行了具体细致的描述,从而方便了人们对该数据字典的应用。

    2)在数据字典指南中,对数据实体之间、实体与属性之间的相互关系进行了描述,并对对象的主要类型、标记方法等进行了详细介绍;各专题又分别以对象为单元,列出了整个数据库所包含的全部对象,使整个数据库的对象内容清楚、明了。对实体对象的描述和标记成为该数据字典的最大特点。

2 关于国内矢量地形图数据字典标准的编写方法及其主要内容的思考

    国内矢量地形图数据字典标准的制定,必须在充分研究我国矢量地形图数据(库)用途和特点的基础上,吸收国外发达国家矢量地形图数据(库)数据字典标准的精华,结合ISO/TC 211等相关国际标准的要求,本着科学、合理、先进、实用的原则加以编写。数据字典的编写应注意以下几个方面:

    1)数据字典的编写,除了对各要素数据的具体描述外,还应对数据字典中所涉及的主要原则、概念、要素描述的要求等内容作详细说明。

    2)可以参考新西兰地形数据数据字典指南中,关于要素实体、对象及其属性的概念描述。数据字典对要素的具体描述,常常是通过对要素的几何对象的描述来完成的;因此对一个要素的描述,首先应该确定该要素所包含的几何对象特征(点、线、面等),然后通过对几何对象的逐一描述,完成对该要素的相关描述。

    3)关于一个要素(或几何对象)属性的描述,是数据字典内容的重要组成部分。矢量地形图数据字典是基础地理信息数据库建设的基础,也是我国不同行业所依据的基础地理信息平台;因此,关于一个要素(或几何对象)属性项的确定,应在充分征求不同行业意见的基础上,通过认真的分析、研究加以确定。千万不可随意设定。

    4)关于要素(或几何对象)属性的描述,或许可借鉴澳大利亚地学GIS产品数据字典的经验,通过属性链接查询表对各属性项描述的具体要求加以规定,从而使要素的描述与属性项的描述相互关联,浑然一体,同时又可克服页面大小的限制。

    5)数据字典对具体要素的描述,主要应包括要素的名称、定义(或描述性说明)、包含的几何对象及其分类代码、所包括的主要属性以及关于各属性项描述的具体要求等。另外,对于要素(或几何对象)的图层、与其他要素空间表示关系示例、重要的注释等都可成为数据字典要素描述的内容。

    6)数据字典的标准要注意同各相关标准或已创建的相关数据库或地理信息系统的协调、一致,如分类代码标准、数据转换标准、元数据标准、地形图图式等,从而尽量减少地理信息数据资源的浪费,提高数据共享水平。

自然资源部测绘标准化研究所主办

E-mail:chbzh1985@163.com

电话:(029)87604238 传真:(029)87604229

地址:西安市友谊东路334号 邮编:710054

扫一扫微信公众号

请使用IE10及以上版本浏览器!