近年, 随着电网工程投资规模的逐步加大, 工程造价数据的种类和容量也越复杂, 显现出了“海量数据, 知识匮乏”的现状, 因此, 如何科学、有效地梳理和应用造价数据成为当下的一个难题。数据集中管理、造价关键影响因素与费用关联性分析体系研究, 以造价数据的有效挖掘构建智能高效的数据仓库, 满足造价管理业务的实际需要, 实现“精细化投资”的靶向定位。
目前, 电网工程的估算、概算、结算等相关造价数据分散在建设单位、设计院、施工单位等专业管理人员手中, 缺乏统一的业务数据收集平台;工程各造价阶段数据的编制标准、计价模式不同, 编报人员的业务素质参差不齐, 数据质量及采信程度不高, 制约了数据利用效率;当前数据统计、采样、分析的层次和方法过于简单, 制约了电网工程项目投资控制、造价统计分析等工作向精益化、标准化方向发展。
相对于大数据管理, 电网工程造价数据不仅具有种类多、流量大、容量大等特性, 更在于其内含的数据价值高。卢建昌等人论述数据挖掘对电力企业的影响和挖掘技术的方法, 指出数据挖掘在电力企业具有广泛的应用途径和前景。基于此, 黄恒振建立了大数据和BIM的工程造价管理模型, 并指出大数据技术有助于提高工程造价管理水平, 刘宏志等人以大数据为理论基础, 分析了电网工程的设计、施工、决算中造价指标体系的构建及数据管理流程, 从模块化体系的更新、多元化预测模型、数据库信息共享几方面给出了大数据理论在工程造价中的建议, 系统地提出了大数据仓储下的电网工程造价分析管理框架, 宋渝茜分析了电网工程造价体系后, 基于大数据理论构建了电网工程仓储体系, 并提出了电网工程造价的数据管理流程及框架, 现有研究仅实现了技经数据的存储、查询、统计等基本功能, 缺乏深入挖掘海量数据背后潜在的价值。工程的基本情况信息、技术经济指标信息、各层级费用信息均蕴藏于各阶段造价数据中, 通过对其标准化与结构化的存储, 通过对最小粒度费用及技术经济参数指标的提取与分析应用, 构建检测及预警业务支撑、工程造价指标的有效检索和提取, 造价影响关键因素指标动态监控的技经数据仓库, 为工程投资决策和造价管控提供关键基础数据。
电网工程造价数据按照专业划分, 可分为基建、技术改造 (大修) 、配网等。按照工程建设阶段可大致划分为估算 (可行性研究阶段) 、概算 (初步设计阶段) 、施工图预算及工程量清单 (招标阶段) 、阶段性结算 (施工阶段) 、结算 (工程竣工) 等造价文件。
本文仅以基建工程的估算、概算、结算的造价文件入手, 按照基建工程中变电工程、线路工程为大类, 面对目前结构化、半结构化数据现状进行的相关数据清洗和挖掘工作, 从技术经济参数、工程费用的角度, 梳理造价数据和业务功能间的关联性, 以关键数据为导引, 控制数据的入库维度和细度, 利用大数据体系中数据挖掘、联机分析处理 (OLAP) 等技术, 利用回归分析、敏感性分析、基于因子绝对值的邓氏关联度等分析方法, 将容量巨大、信息分散的造价数据过滤出来, 构建具有可扩展性强、数据利用率高、容错性高的数据仓库。具体构成如图1所示:
根据数据来源和系统功能的双重考量, 结合数据的异同点, 抓住影响造价的关键经济指标, 即技术经济参数;根据工程费用体系, 按照费用分级的原理, 抓住主要费用;剖析技术经济参数和工程费用的内在联系, 构建造价数据仓库中的关键指标数据体系。工程概况的相关信息与技术经济参数的数据重合, 将不作介绍。按照本文的限定, 在此介绍变电工程和线路工程的技术经济参数和费用体系。
变电工程技术经济参数见图2。其中, 特别考虑外购土工程量, 因在实际项目中此部分影响造价较大。主变及进出线钢构架支架数量、主变及进出线基础混凝土量均为主变、高压侧、中压侧、低压侧的合计数量。
线路工程技术经济参数见图3。其中, 地形和土质按各类型占比考虑, 且加总为100%。地形分为:平地、丘陵、河网、泥沼、山地、高山、沙漠、峻岭;土质分为冻土、普通土、坚土、松砂石、水坑、泥水坑、流沙坑、岩石爆破、岩石人工;基础型式分为台阶式、板式、插入式、掏挖、岩石嵌固、锚杆、灌注桩、人工挖孔桩、其他;杆塔型式按材质分为角钢塔、钢管塔、钢管杆、水泥杆;按类型分为直线塔和耐张塔。耐张转角塔占总基数比例影响造价较大, 特别列出。
变电和线路工程的费用分级如图4、图5, 其中, 编制年价差、基本预备费、建设期利息等费用在整个费用组成中是不可缺少的, 但在后期数据仓库的应用中, 这些费用对在线分析等功能而言, 可以弱化。
另外, 变电工程的其他费用组成为建设场地征用及清理费、项目建设管理费、项目建设技术服务费、整套启动试运费、生产准备费、大件运输措施费, 线路工程其他费用组成为建设场地征用及清理费、项目建设管理费、项目建设技术服务费、生产准备费。
费用的划分, 可根据实际需要, 对其继续细分, 如110k V变电站工程中, 配电装置部分可细分为110k V配电装置、35k V配电装置等。
基于以上造价数据仓库建立原理, 结合网省公司的业务管理需要, 构建了基于WEB应用服务业务支撑平台, 实现工程造价数据集中管理、造价分析报表辅助编制, 各项费用及技经指标对比分析, 估算评审、概算评审提供辅助支撑, 造价水平动态监控及预警等业务应用, 为开展造价管理、造价分析、概算评审、造价动态管控等业务工作提供系统性支撑。
采用Mysql构建底层数据库, 通过Hibern持久层与Entity数据实体层支撑基础模块与业务模块, 最终通过展现层实现前台数据及页面应用展现, 具体业务逻辑构架如图6所示。
依据输变电工程造价数据库, 结合造价分析、辅助评审、在线分析业务, 建立造价数据至造价分析、造价数据至辅助评审、在线分析数据交互关联关系。实现对工程造价数据的全面应用, 具体的数据交互如图7所示。
功能:实现工程估算数据与通用造价对比分析、概算数据与通用造价对比分析、概算数据与可研估算对比分析、概算数据与造价控制线对比分析, 展现对比结果, 辅助技经人员开展工程技经评审工作, 具体业务流程如图8所示。
创新点:通过已建立的工程历史造价数据、通用造价数据、造价控制线数据, 根据技术参数自动比选方案及适配, 通过子模块替换后汇总计算评估, 辅助专家开展概算评审。
功能:在已收集的数据仓库历史工程造价数据库的基础上, 实现国网造价分析、能源局造价分析、省公司造价分析基础数据灵活配置及生成。
创新点:由系统根据各类造价分析基础数据配置报表, 自动抽取造价分析指标值并校验数据的规范性, 并支持人工修编调参, 支持追溯数据源及保存调整记录, 具体业务流程如图9所示。
功能:应用造价数据仓库中数据, 形成对工程的定向分析、结余情况、造价水平、造价单价趋势等分析业务。从宏观到微观, 从工程总投资细分到单位工程的造价数据、到关键技术经济因素的分析, 逐层呈现各级造价数据对比分析, 便于管理者快速及精准地了解工程造价情况, 具体业务流程如图10所示。
创新点:通过造价指标数据的智能抽取规则及数据分析算法, 分级进行造价数据分析。
从电网造价工作实际出发, 基于大数据理念, 本文研究了大数据下的电网工程造价数据仓库的建立及其应用, 筛选了基础指标, 梳理了指标关系, 形成了电网造价数据仓库的架构, 功能上实现了数据入库、数据采集、数据检索、数据对比分析、数据管理, 业务上实现了对辅助评审、造价分析、在线分析等技经业务的支撑。但是大数据的概念是海量数据、深入挖掘应用。因此, 需做到全口径数据关系的横纵贯通, 进一步分析技术指标与经济指标间的敏感性。通过软件开发和数据云的支撑, 实现数据系统的信息共享、横向和纵向的高效运转, 为省公司和各地市公司的技经业务提供数据支撑。此外, 随着大数据理论的发展, 应不断优化系统算法, 纳入新的数据分析方法, 做到大数据、小系统、多功能的电网工程造价数据仓库和业务支撑平台。