2.2 决策支持工具
提供从数据查询到信息挖掘的各类工具,满足决策支持或多维环境下特定的查询和报表需求,使分析人员、管理人员或执行人员能够从多个角度对从原始数据中转化出来的、能够真正为用户所理解的并真实反应企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解。它的技术核心是“维”这个概念,因此它是数据仓库中大容量数据得以有效利用的重要工具。
2.3 访问工具
接口和中间件,使维护人员能够访问和处理数据库和文件系统中的数据信息。数据库中间件允许维护人员透明地访问后台各种异构的数据库服务器。数据管理部分一般采用3层信息存储,最高层次是数据仓库,数据仓库中集成了主动配电网的主要展示指标信息;中间级是各子系统的数据仓库,它为各个业务系统服务;结构的最低层次存储了根据用户和应用需求经过裁剪后的信息。
2.4 数据清洗的方法
数据经过数据的清洗转换处理后,或装载到数据仓库,通过联机分析处理为生产调度决策、全景展示提供数据支撑。
2.4.1 数据抽取
根据全景信息展示系统的需求,从相应的调度业务系统、外部数据源中抽取需要的数据。此企业数据仓库本身是基于Oracle 9i开发的,配网的实时数据库通过开放数据库连接(open database connectivity,ODBC)接口导入到Oracle关系数据库。由配电自动化以及其他生产管理系统运行时产生的业务数据和其他数据本身是基于Oracle 9i关系数据库定义的,这些数据通过Java数据库连接(java database connectivity,JDBC)接口就可导入到数据仓库,然后在数据仓库的基础上进行决策支持。
2.4.2 数据转换
数据转换是指根据全景信息展示系统平台的要求从各业务系统中抽取数据,进行数据的转换、清洗等处理,保证数据按要求装入数据仓库。根据实时数据库和历史数据库的具体特点,做了不同的转换操作。
2.4.3 数据加载和更新
数据的加载周期应和数据仓库中时间维度的粒度匹配,可以按分、时、日等颗粒度进行加载。此外数据增量的更新需在数据源系统中进行定位,确定数据删除和更改的内容。如果是数据仓库的全面更新则一般在初始化的时候执行,按照数据源到目标系统的映射关系,将数据加载到数据仓库的物理存储区域上。
3、系统实现
3.1 综合信息展示
在某地区的配电自动化系统中实施中, 构建面向预评估、实时监视与后评估等不同时间维度的主动配电网调度运行指标体系,覆盖配网调度业务的全过程,从安全、经济、质量、节能、效率、供需、公平7个维度分别形成完整的子指标集。在此基础上,通过对指标多维属性的梳理、拓展与应用,分别从时间、对象、业务、主题、管理5个维度对每一个电网调度运行指标进行分类与整合,使庞杂、无序的运行信息系统化、有序化。
面对配网的海量数据,将其分为调度对象与设备元件,调度对象包括发电机组、变电站、输配电线路等,设备元件和现有配网一次设备的定义相同。在主动配电网的全景信息展示系统中以调度对象为切入点,将电网运行中海量的数据与指标通过分解、筛选、归类集中到不同的调度对象上,从多个方面综合地分析调度对象与设备元件的运行情况。可以专注地分析特定对象的历史运行状态变化;可以横向地比较不同对象的运行状态;提高信息的集成度与获取效率,提高调度管理、考核工作的精益化水平。对设备元件按其物理特性建立相应的多维分析指标体系,如变电站的属性信息包括,变电站的基本属性、下送曲线、检修情况,变电站内其他二次设备的运行情况等,同时提供横向比较、纵向查询、离群状态提示、历史状态比较、排名计算等高级分析功能。系统主页效果见图4,大客户的具体展示信息见图图5。