吕玉霞 段怡红
(国家测绘局测绘标准化研究所 西安 710054)
摘 要 矢量地形图数据字典是矢量地形图数据库建设的基础。介绍、分析了国内外矢量地形图数据字典标准的现状,并对我国矢量地形图数据字典的编制内容和形式进行了研究、探讨。
关键词 数据字典 属性 要素
近些年来,随着计算机技术、网络技术及信息获取与处理技术的飞速发展,基础地理信息产业发生了巨大的变化。数字基础地理信息生产技术体系取代了传统的模拟测绘技术体系,并逐步向网络信息化方向转变。数字地形图,特别是矢量数字地形图的生产及其数据库的建设是基础地理信息系统及其网络体系建设的基础和关键。目前,在矢量地形图的生产及其数据库的建设过程中,由于需要采集的数据要素较多,要素之间相互关系比较复杂,加之目前尚没有一套关于矢量地形图数据库数据(特别是关于矢量地形图数据库数据字典)方面的规范发布,从而给数据的生产和建库造成了一定的困难和不便。因此,编制一套切实可行的、科学的数据字典是目前矢量地形图及其数据库生产所面临的最迫切的任务之一。
数据字典是关于地理实体数据描述信息的集合。矢量地形图数据字典是关于矢量地形图所包含的所有地理实体数据描述信息的集合,它有利于数据库建库的标准化、规范化,同时也有利于基础地理信息系统之间的数据共享和转换。
目前,各地方在进行矢量数字地形图及其数据库的生产建设时,由于地理空间实体种类较多,信息描述也比较复杂,又没有一个统一的数据字典,对地理实体的描述没有一个统一严格的规定;因而造成数据的不一致,数据的兼容性较差,数据共享困难,严重阻碍了基础地理信息系统及其网络体系的建设。
我国对矢量地形图数据字典的研究始于20世纪90年代中期,并于本世纪初编制了《1:10 000基础地理信息数据库数据字典》暂行规定。现在看来,该暂行规定已经远远不能满足数据生产和建库的需要,如,其要素的分类过分依赖有关的图式,数据字典对要素的属性以及要素的几何特征描述不足等。目前,有关部门正着手编制新的有关矢量地形图数据的数据字典。本文旨在通过介绍和分析美国、加拿大、澳大利亚以及新西兰等国家矢量地形图数据字典的现状,为我国数据字典的编写方法和内容提供一些有益的参考,同时对我国数据字典的编写进行一些有益的探讨和尝试。
1 国外矢量地形图数据字典情况介绍与分析
1.1 美国DLG-F数据字典情况介绍与分析
1.1.1 美国“DLG-F数据字典—水文”与“DLG-F数据字典—交通”情况介绍
美国乔治亚大学(University of Georgia)信息技术开发服务中心(Information Technology Outreach Services)于1998年4月25日和1999年3月12日分别开发了“DLG-F数据字典—交通”与“DLG-F数据字典—水文”。这2个数据字典格式上基本一致,即分别利用表格的形式对水文和交通所包含的要素进行了描述。其中,“DLG-F数据字典—水文”分别对以下12个要素进行了描述:水网区、人工渠道、运河/沟渠、封闭线、连接处、湖泊/池塘、管线、水库、海/洋、岸线、溪流/河流、沼泽/湿地。“DLG-F数据字典—交通”则对以下9个要素进行了描述:机场、桥梁、直升机起降场、线路标识、里程碑、铁路、公路段、跑道/停机坪/滑行道、下跨道;另外,该字典还给出了附录 A(由乔治亚DOT指定的线路标识识别码),附录B(乔治亚州桥梁和地下通道类型)。
在这2个数据字典中,每一要素都以表格的形式对要素的名称、定义、要素分类、层名、属性表和DLG-F属性等项进行了描述和规定。
1.1.2 美国“DLG-F数据字典—水文”要素数据字典样式示例
这里以“DLG-F数据字典—水文”中的“水库”为例,来说明这2个数据字典关于要素描述的具体内容和样式,如图1所示。
DLG-F要素:
|
水库
|
定义:
|
人工建造的、用于蓄水或蓄积其他液体的水池
|
要素分类:
|
面
|
层名:
|
HY_POLY
|
属性表:
|
HY_POLY.PAT
|
DLG-F属性
|
Arc/Info术语
|
数据类型
|
属性范围
|
定义
|
要素
|
FEATURE
|
字符型25
|
字符的
|
DLG-F要素的名称
|
要素ID
|
FEATURE_ID
|
字符型10
|
字符的
|
唯一、永久的要素ID码
|
州FIPS代码
|
STATE_FIPS
|
字符型2
|
2位整数
|
包含该要素的州FIPS代码
|
县FIPS代码
|
COUNTY_FIPS
|
字符型3
|
3位整数
|
包含该要素的县FIPS代码
|
水文单元代码
|
HUC
|
字符型8
|
8位整数
|
包含该要素的盆地的8位数水文单元代码(HUC)
|
名称
|
NAME
|
字符型32
|
字符的
|
水库的地名
|
数据源
|
SOURCE
|
字符型32
|
字符的
|
采集要素的数据源
|
编辑(者)
|
EDITOR
|
字符型32
|
字符的
|
完成要素更新的实体
|
数据源日期
|
SOURCE_DATE
|
日期
|
日期
|
数据源的日期
|
要素更新日期
|
FEAT_MOD_DATE
|
日期
|
日期
|
最后更新要素的日期。
|
图1 “DLG-F数据字典—水文”中“水库”要素样式示例
1.1.3 美国“DLG-F数据字典—水文”与“DLG-F数据字典—交通”的特点分析
从以上对这2个数据字典的介绍和样式示例中可以看出,这2个数据字典有如下特点:
1)要素的名称、定义、要素分类(几何)、层名、属性表以及该要素各属性项的描述和规定构成了这2个数据字典每一要素描述和规定必不可少的内容。
2)由于不同要素需要表达的属性内容不同;因此,在对每个要素的描述和规定中,其DLG-F的属性内容不尽相同,但每个要素都包含有该要素的名称、识别码、要素类型、州FIPS代码、县FIPS代码、数据源、编辑(者)、数据源日期、要素更新日期等基本属性项。对于要素的每一项属性,又分别从Arc/Info术语、数据类型、属性范围、定义4个方面进行了描述和规定。
3)对照美国的1:24 000比例尺数字线划图标准(即DLG-F)的水文与交通部分与“DLG-F数据字典—水文”、“DLG-F数据字典—交通”2个数据字典可以发现:2个数据字典中所描述的要素大部分为数字线划图标准相应部分中所包含的要素,但也有个别要素并非数字线划图标准相应部分的要素,如“DLG-F数据字典—水文”中的人工渠道等;同时,这2个数据字典并没有对数字线划图标准相关专题部分所包含的所有要素加以描述。另外,数据字典中关于要素的定义、属性项的规定等与数字线划图标准中的规定基本相同,但数据字典中要素的属性项并没有包含数字线划图标准中相应要素的所有属性项。例如,对于湖泊/池塘要素,数字线划图标准中该要素的属性项包括高程、水文类别、名称、水位、水质特征以及影像更新类别等项;而数据字典中该要素的属性项则不包含高程、水位、水质特征等。关于DLG-F标准与这2个数据字典的关系,还有待于作进一步的探讨。
1.2 加拿大国家地形数据库(NTDB)数据字典情况介绍与分析
1.2.1 加拿大国家地形数据库(NTDB)数据字典内容介绍
加拿大国家地形数据库(NTDB)数据字典包括NTDB中可能出现的所有实体、实体间的相互关系以及其他有关信息。该数据字典由两部分组成,即实体描述部分和附录表格部分。
该数据字典的第一部分“实体描述”按照一定的顺序对实体进行了描述。一个实体包括正式的实体名称、实体所隶属的专题、实体的定义、实体属性及其值、属性值的合并和它们相应的编码、几何表示规定、尺寸要求、空间表示类型(2维或3维),不包括高程的平面图案、关系、图示和附加说明。附录部分则以表格形式对国家地形数据库中的实体进行了逐个描述。
1.2.2 加拿大国家地形数据库(NTDB)数据字典实体描述样式示例
下面以加拿大国家地形数据库(NTDB)数据字典中的实体“桥梁”为例,来说明该数据字典实体描述的具体内容和样式,如图2所示。
人工要素
|
 |
|
桥梁
|
|
固定属性
桥梁的结构:
(0)一般的/未知的。
(1)被覆盖的:桥具有用来保护桥面的像盖子一样的建筑物。
(2)可移动表面:可以移动桥的一部分,从而使船只通行。
(3)其他:除了“被覆盖的”和“可移动表面”外的其他情况。
|
可变属性
无
几何表示规定
· 位置明确的
· 位置接近的
|
|
|
|
|
|
|
|
属性值的合并
|
|
NTDB码
|
|
1:50 000
|
|
1:250 000
|
●
(点)
|
~
(线)
|
┊┊
(面)
|
●
(点)
|
~
(线)
|
┊┊
(面)
|
一般的/未知的
|
91
|
|
2139
|
|
|
2139
|
|
被覆盖的
|
92
|
|
2140
|
|
|
|
|
可移动表面
|
93
|
|
2141
|
|
| |