油气资源作为重要的能源矿产和战略性资源, 关系着国民经济和社会发展, 关系国家安全。一些经济发达的西方国家, 已建立并部分实现了油气资源数据的联机检索、商业化服务等。中国油气资源数据库建设从上世纪80年代开始迅速发展, 但一直较为分散, 没有形成统一的整体。在1999年启动的“数字国土”工程中, 中国拥有具有一定规模的油气资源类数据库近百个, 基础数据库建设被列为核心内容。国家级油气资源数据库的建设, 其目的就是为了弥补这一空白, 为政府提供决策支持。国家级油气资源数据库是在全国层面建立的统一基础数据库[1]。本系统数据量很大, 数据种类繁多, 情况复杂, 格式各异, 要采用恰当的数据处理方式, 保证数据的有效利用。数据库由10个专题构成, 通过建立专题数据依赖关系, 实现属性数据和空间数据的统一查询和汇总等功能。本系统遵循国家标准编码规范进行编码, 并依据专题数据特点分级设置, 便于数据库标准化、质量控制和后期产品升级等问题。对属性数据和空间数据的结构进行详细设计, 解决了数据关联问题。各专题采用增量式开发, 最终生成油气资源数据仓库。
本系统用Oracle11g[2,3]和Access 2003分别作为B/S系统和C/S系统的后台数据库。使用UML[4]和面向对象数据库设计建模和编码, 完成对属性数据复杂的CRUD操作和空间数据处理。
国家级油气资源数据库, 以全面、系统、及时综合掌握全国油气资源的勘探开发信息, 支撑国家油气资源可持续发展战略为目标, 本系统数据有如下特点:
(1) 海量数据作为国家级第一个完整的油气资源数据库, 本系统包含来自国家部委、勘探单位、石油公司、科研单位等多年的各类油气资源数据。如何对海量数据进行有效的提取, 组织, 是系统的首要目标和难点。
(2) 数据种类繁多本系统是采集、传输、存储、处理和服务社会的数字化、网络化、智能化系统, 系统包含各类结构化数据, 各种比例尺的公共、专用地图等这类非结构化数据。
(3) 数据情况复杂格式各异数据来源的不同, 导致本系统数据源情况复杂, 同一类数据存在格式不同的特点, 采用专门开发ETL工具对数据进行处理, 保证数据的无损转换。
针对海量数据处理的问题, 数据库从内容上分为十个专题, 分别是:盆地专题、省区专题、管线炼化专题、区块专题、年检专题、督察专题、钻探专题、物探专题、公司专题和储备专题[5]。每个专题之间存在各种各样的关联关系, 由于关联关系非常复杂, 见图2。以油气资源区块登记专题 (以下简称区块专题) 为例, 与盆地专题的关联:区块登记图与所在盆地要一致, 勘查登记、采矿登记的项目数与面积情况应在盆地统计中体现;与省区专题的关联:使用省区专题的空间数据作为底图, 勘查登记、采矿登记的项目数与面积情况应在省市区的统计中体现;与油气资源勘查投入专题的关联:查询勘查, 采矿区块已登记的项目, 体现出其投入完成情况;与督察专题的关联:查询勘查、采矿区块登记的项目, 体现出其督察情况等。
10个专题的属性数据与空间数据是相对独立的两个部分, 但要实现属性数据和空间数据统一融合。采用在空间要素文件[6]的属性表中加入属性数据表中的关键字, 使属性数据与空间数据通过关键字进行外键关联[7], 解决二者的关联问题。
本系统从逻辑上包括空间数据库与属性数据库两部分, 其组织结构如图1。
(1) 空间数据库分为基础地理信息和专业地理信息。基础地理信息包括地理底图和地质地图两种, 本课题使用的地理底图有1︰400万的全国行政区划图, 国界图层, 全国市 (地区) 级政区图, 全国县级政区图, 全国省、市、县界图层;地质底图主要有含油气盆地图层等。专业地理信息指采矿权、探矿权、重重磁电化等专题专用图层。
(2) 属性数据库主要包含各专题所对应的属性信息, 如油气勘察登记、油气地质调查等各种信息。
国家级油气资源数据库存在海量数据特点, 为提高代码可读性和重用性, 保证开发顺利进行和产品升级, 参考国家标准, 结合本系统数据实际特点制定本系统编码规范。
国家级油气资源数据库采取增量式开发, 各专题按照推进的次序进行编码, 用2位十进制数字构成专题编号, 用专题中英文名称进行注释。
为完成各个专题的特有功能, 同时满足跨专题复杂查询的要求, 需要对涉及的专题数据进行功能编码[8]。采取分“级”的设计思想。以最为复杂和繁琐的盆地专题数据库为例。该专题数据按照盆地、一级构造单元、油气田三层结构组织, 每层有自己的属性数据和空间数据, 并与其它两层数据相关。其中盆地相关属性有盆地基本信息、盆地资源量信息、盆地地层信息;一级构造单元相关属性有一级构造单元基本信息、一级构造单元资源量信息;油气田相关属性有油气田基本信息、油气田储量信息、油气田含油气层系信息。其中盆地地层信息和油气田含油气层系信息都共用地质层位词表, 该表又分为五级:界、系、统、组、段。其中, 界、系、统三层是时间概念, 所有盆地共用一套词表, 组和段除时间概念之外还有空间概念。因此, 词表的结构与界、系、统三层有所区别。在词表编码的时候, 对地层词表进行了特殊处理, 使之能够满足用户的实际需求。
设计编码如下:界的编码为两位, 例如, 新生界的编码为01;系的编码为4位, 前两位代表所属的界编码, 例如, 新生界的古近系编码为0103;统的编码为6位, 前四位为所属系的编码, 例如, 古近系的渐新统编码为010301;组由于涉及到所属盆地的概念, 因此编码为12位, 前六位为所属统的编码, 7至10位为所属盆地的编码, 例如, 东营组的编码为010301130101, 东营组属于渐新统且在渤海湾盆地;段的编码为14位, 前12位为所属组的编码, 东一段的编码为01030113010101, 代表渤海湾盆地的新生界、古近系、渐新统的东营组东一段下的地层。
系统开发使用Microsoft公司的Microsoft Visual Studio 2008 (C#语言) 作为集成开发工具, 基于ADO.NET、Arc GIS Engine[9]进行GIS的组件式开发, 并采用Arc SDE[10]进行统一的空间数据访问, 后台数据库采用Access (数据采集阶段) 和Oracle (系统运行后) , 采用Oracle 11g OLAP工具进行应用服务开发。后台数据库是基于对象-关系数据库。通过对Arc GIS Engine (底层Arc Objects) 进行客户化开发[11], 实现矢量的点、线、面的基本操作和网络拓扑及栅格的操作, 使得用户不再局限于对数据的浏览和查询, 达到了图文并茂、生动直观的效果, 尤其是真实呈现石油各专题的数据的图形形态。
国家级油气资源数据库整合了全国相关油气公司和油田的油气资料, 有利于油气资源信息集成和综合研究和开发, 信息共享和综合利用。本系统利用空间属性一体化技术解决问题, 能充分挖掘油气资源数据库的潜力。本系统全面反映我国及国际油气资源的情况, 既能服务于政府、也能服务于企业和社会, 既能服务于上游、也能服务于下游。系统目前已在国土资源部油气资源战略研究中心部署, 用户反映良好。
上一篇: 基于JIT管理理念的仓库管理系统研究
下一篇: 浅谈煤炭企业仓库管理系统设计与实现