城市基础地理信息系统建设的核心在于数据和基于数据的服务。我国目前拥有的空间数据格式多种多样,有AUTOCAD格式、MicroStation格式、EPSW格式等,数据大多数是数字线划图(DLG),地形图和专题图的修测也是在DLG基础上进行的,其中大比例尺地形图是DLG中的一种常见数据。可见DLG仍是我国地理信息系统的主要数据源。随着地理信息系统的普及应用,GIS技术和计算机辅助地图制图技术在社会各领域的应用越来越广泛,GIS数据和电子地图数据的社会需求爆炸性增长,随之,各具特点的GIS和制图应用软件如雨后春笋般涌现。应用软件系统的增多,带给了用户更大的选择性,同时,不同应用软件之间数据转换的问题也随之出现。许多单位存在大量已经数字化了的空间数据,基础地理信息系统建立的核心就在于这些基础地理信息数据的处理。在数据采集的实际生产过程中,往往需要应用多种软件系统才能达到最终产品的要求,这就必须进行数据转换;而进行数据转换也是数据再利用的途径之一。文章对DWG格式的空间数据ARCGIS数据入库的转换过程进行讨论。
由于空间数据的来源和作业方式不同,数据的分类编码、特征定义及存储格式等经常不一致,这就需要按照一定的规则对他们进行编辑加工。对数字线划地形图数据在数据分类分层、属性定义、图形表示以及注记等方面进行规范化的数据重组、格式转换、拓扑处理和质量控制,能使之成为符合GIS要求的数据源。在此基础上,使用数据库管理系统和空间数据引擎,可建立无缝矢量数据库。
数据源转换
目前,实现数据交换的模式大致有4种,即外部数据交换模式、直接数据访问模式、数据互操作模式和空间数据共享平台模式。后3种数据交换模式给人们提供了较为理想的数据共享模式,但是对国内大多数普通用户而言,外部数据交换模式在具体的工程应用中更具可操作性和现实性,与现实的技术、资金条件更相符。因此,空间数据转化目前主要通过外部数据交换文件进行。大部分GIS软件定义了外部数据的交换格式,一般为ASCII码文件,如ARC/INFO的E00,MAPINFO的MID,AUTOCAD的DXF等,这样,系统之间的数据一般要通过2-3次转换,见图1。
以AUTOCAD的DWG格式为例,采用DWG-E00-COVER
-AGE格式的方法来进行数据格式的转换。过程体现见图2。
空间数据转换的内容主要包含三个方面的信息:其一是空间定位信息(实体的坐标);其二是空间关系信息(几何实体之间的拓扑或几何关系数据);其三是属性信息(几何实体的属性说明数据)。例如,房屋可以数字化为一组连续的像素或矢量表示的实体,并可用一定的颜色、符号把GIS的空间数据表示出来,这样,房屋的类型就可以用符号来表示,而房屋的属性数据则是指房屋的高程、房屋楼层数、房屋面积、房屋名称、房屋结构、房屋用途、房屋所属人等。这些数据都与房屋这一空间实体相关。这些属性数据可以通过给予一个公共标识符与空间实体联系起来。AUTOCAD的DWG格式着重描述空间对象的图形表达,也就是空间定位信息,在转化之前需要录入属性信息,按照自定义的属性数据库的内容,对数据中的实体进行扩展属性信息的填充,同时自动生成公共标识码。
按照入库设计要求及方便数据库所存储的空间数据的查询,将矢量数据分为以下几层。如表1。
对各图层在AUTOCAD下进行程序检查,直至数据的空间信息和其扩展属性信息无误。然后通过转换工具,将DWG格式的矢量数据及其属性数据转换为外部交换文件(E00格式),在将E00格式文件转换为ARCGIS的第二代地理数据模型COVERAGE格式(也称地理关系数据模型)。这个模型有两个关键之处:
⑴空间数据与属性数据相结合。空间数据存储在二进制索引文件中,使得显示和访问最优化。属性数据存储在表格中,用等于二进制文件中的要素数目的行来存储,并且属性和要素使用同一ID连接。
⑵矢量要素之间的拓扑关系也被存储。这就意味着,线的空间数据记录包含这些信息:哪些结点分割线、可以推算有那些线相连,同时还包含线的右侧及左侧有哪些多边形的信息。
COVERAGE数据模型的优势是用户可以自定义要素表格:不仅可以添加字段并且还可以建立与外部数据表格的关联。它将二进制文件中的空间数据与表格中的属性数据连接起来。尽管将空间数据和属性数据分开存储,COVERAGE数据模型依然在GIS领域占统治地位。其原因在于:COVERAGE数据模型使追求高性能的GIS成为可能,拓扑关系的存储使得高级的地理分析操作和更精确的数据输入得以实现。
地图符号化
空间数据转入GIS后,要素并不能以符号显示,只是点、线、面实体,不通过属性查询无法识别其是何种地物。其既不符合地图制图要求,也不能满足操作员的直观要求,所以符号匹配是必不可少的。
按照面向对象的思想,根据地图符号的制图特性及其所表示的地物与地理现象的分布特征,地图符号分为点状符号、线状符号、面状符号3类。地图注记因为与点状符号在诸多方面的相似性,故归于点状符号类。在ARCGIS中可以根据自己的意愿,设计和生成属于自己的地图符号,按其基本特性可以将其分为点状符号(Marken Symbol)、线状符号(Line Symbol)、面状符号(Fill Symbol)、文字符号(Test Symbol)。地图符号化实际上在建立好地图符号库的基础上,分别对图层要素进行符号化的过程。其步骤为:
⑴符号库的建立。建立点、线、面状符号;
⑵符号的分类与命名。对建立好的符号进行分类与命名;
⑶符号转换。利用符号转换工具进行转换;
⑷符号模块的设计。对符号化具体实现进行设计;
⑸符号化的实现。对图形进行设计。
数据整合
经过转换入库的数据还存在一定的问题,还不能直接用于空间分析,需要经过必要的编辑和处理,例如图幅间空间数据的拼接问题。在传统的地图制图学中,为了解决用有限的地图纸张不能描述无限的地球表面信息之间的矛盾采用了地图分幅的方法。同样,在空间数据库中,为了解决无限的地球空间信息与有限的计算机资源之间的矛盾,也可以采用分幅存储管理和处理。但从理论上讲,无图幅数据库是最理想的,即整个制图区域的实体在物理和逻辑上都是连续的、无裂缝的、整个制图区域在数据库中相当于一个整体。为实现无图幅的数据库必须对图幅数据进行二次加工。
在相邻图幅的边缘部分,由于原图本身的数字化误差,使得同一实体的线段或弧段的坐标数据不能相互拼接,或是由于坐标系统、编码方式等不统一,需进行图幅数据边缘匹配处理。
1、逻辑一致性处理
两个相邻图幅的空间数据库在接合处可能出现逻辑裂缝,如一个要素幅图层中具有属性A,而在另一幅图层中属性为B。此时,必须使用交互编辑的方法,使两相邻图斑的属性相同,取得逻辑一致性。如图3(b)所示。两图幅中有两个要素具有相同的属性值,而且接边误差在允许范围内,程序就会自动合并两要素,并赋予其中一个要素的属性,如图3(a)所示。
2、 图幅合并
在GIS中经常需要将相邻的多图幅的同一层数据或多图层数据合并在一起,此时涉及到空间拓扑关系的重建。但对于多边形数据,因为同一目标在两图幅内已形成独立的多边形,合并时,需要去掉公共边界。如图4,跨越图幅的同一多边形,在它左右两个图幅内,借助于图廓边形成了两个独立的多边形。为了便于查询和制图(多边形填充符号),现在要将他们合并在一起,形成一个多边形。此时需要去掉公共边,实际处理过程先删除两个多边形,解除空间拓扑关系,然后删除公共边(图廓边),然后重建拓扑关系。
3、图幅接边
由于空间数据采集的误差和人工操作的误差,两个相邻图幅的地图的空间数据在结合处可能出现逻辑裂隙或几何裂隙。逻辑裂隙指的是一个地物在一幅图的数据文件中具有地物编码A,而在另一幅图的数据文件中却具有地物编码B,或者同一物体在这两个数据文件中具有不同的属性信息,如公路的宽度、等高线高程、房屋结构等。几何裂隙指的是由数据文件边界分开的一个地物的两部分不能精确地衔接。因此,在地理信息系统和机助制图中,需要把单独数字化的相邻图幅的空间数据在逻辑和几何上融合成一个连续一致的数据体。
数据入库
目前,大多数GIS软件都逐渐倾向于采用空间数据和属性数据一体化的管理方式,而且选用大型数据库作为存储空间数据和属性数据的数据库管理系统。以ARCGIS为平台,通过ARCSDE作为数据通信的桥梁挂接功能强大的ORACLE数据库来存储和管理数据文件。
ORACLE数据库是数据库领域中的佼佼者,已经成为世界上最流行的数据库平台之一。它支持多种硬件及操作系统、多种网络通信协议和多种数据库管理系统的互联。
ARCSDE是一种构建于大型关系数据库(ORACLE,SQL SERVER等)之上的空间数据引擎(SPATIAL DATABASE ENGINE)。它可以看成是一个连续的空间数据模型,借助这一模型,我们可以用关系数据库(RDBMS)。来管理空间数据。在RDBMS中融入空间数据后,ARCSDE可以提供对空间、非空间海量数据进行高效率操作的数据库服务。由于ARCSDE采用了客户/服务器体系结构,大量用户可以同时并发地对同一数据进行操作。
ARCSDE以一种连续的、无缝的数据库来管理大型地理数据要素,它一方面提供了对海量空间数据与属性数据的快速存储、更新、编辑和各种维护功能;另一方面,它提供了基于SQL语句和实体对象间空间关系的快速查询功能。ARCSDE提供客户端与服务器的应用程序开发接口(API),从而使得开发用户能够根据具体应用的需要,利用SDE的强大数据管理和查询功能来开发自己的应用系统。见图5
在ARCGIS的ARCCATALOG里,以ARCSDE建立的数据通道,把COVERAGE数据通过DATABASE CONNECTION以表的形式存入ORACLE数据库中。这样我们就可以通过程序来显示、查询和分析所存数据的空间信息和属性信息,以形成一个完善的地理信息系统。
结束语
数据格式转换,是集成多格式数据的一种通用方法,但是由于缺乏对空间对象统一的描述方法,不同格式用以描述空间数据的模型不尽相同,以至于数据格式转换总会导致或多或少的信息损失。DXF着重描述空间对象的图形表达,而忽略了属性数据和空间对象之间的拓扑关系;E00侧重与描述空间对象的关系(如拓扑关系)而忽略了其图形表达能力。另外,通过交换格式转换数据的过程较为复杂,需要首先使用软件A输出为某种交换格式,然后再使用软件B从该交换格式输入。一些单位同时运行着多个使用不同GIS软件建立的应用系统,如果数据需要不断更新,为保证不同系统之间数据的一致性,则需要频繁的数据格式转换。因此,OPENGIS思想和多元空间数据无缝集成技术使我们的发展方向。另外,为测绘、规划、设计及各种数据制作单位和数据使用单位提供了一个现代化的标准体系,改变目前没有统一的数据生产标准、数据兼容性和可操作性差的局面,必将极大地推动和加快"数字城市"及各"数字区域"基础地理空间信息数据库的建设工作、减少重复投资和重复测绘,必将产生可观的社会效益和经济效益,为国民经济建设的各个部门服务。

图1 图2

图3 要素逻辑统一检查 图4

表1 矢量数据分层 图5 ArcSDE系统
(本报转载此文出于传递更多信息之目的,文章由黄欢提供。若为转载,请供稿者注明文章的作者和来源)