二是电力企业运营数据,如交易电价、售电量、配电网、用电客户等方面的数据。这部分可以说是电力大数据中的核心部分,连接着整个电力产业的上、下游。电网企业通过对用户用电情况和上游发电量、电源分布情况的分析协调电能的分配。通过对交易电价、售电量等数据的分析,及时调整运营策略。据了解,美国的100个相位测量装置(phasor measurement unit,PMU)一天收集62亿个数据点,数据量约为60 GB,而如果监测装置增加到1 000套,每天采集的数据点为415亿个,数据量达到402GB。相量监测只是智能电网监控的一小部分。而为准确获取用户的用电数据,电力公司部署了大量的具有双向通信能力的智能电表,这些电表可以每隔5 min的频率向电网发送实时用电信息。美国太平洋天然气电力公司(Pacific Gas & Electric)每个月从900万个智能电表中收集超过3TB的数据。这部分数据整个电力数据中是最为复杂的部分,涉及面广,数据挖掘难度相当大。
三是电力企业管理数据,如ERP、一体化平台、协同办公等方面的数据。这些数据主要是电力企业提高自身竞争力的重要组成部分。随着电网企业的发展,智能电网建设的需要,信息一体化平台建设的重要性突显。一体化平台作为企业管理的重要手段,是内容更精细化、成本集约化的重要途径。而这其中涉及到的数据也相当复杂,长期以来我国都没有对信息系统进行统一的标准规范,增大了信息系统之间的数据交换难度。
现在一般把电力大数据的特征概括为4“V”3“E”, 4“V”即规模大(volume)、类型多(variety)、价值密度低(value),3“E”即变化快(velocity)和能量(Energy)、数据即交互(Exchange)、数据即共情(Empathy)。如果仅仅是从数据的体量特征和技术范畴来讲,电力大数据只是大数据在电力行业的一个子集。但电力大数据自身有着更重要的意义,有着其它行业数据无法比拟的丰富内涵,电力大数据分析迫在眉睫。
电力大数据处理技术面临的问题
通过对电力大数据类型和特点的分析,可以看到电力大数据分析十分复杂,面临许多挑战。
随着智能电网建设的加速,电力数据已远远超出关系型数据库的管理范畴,地理信息系统以及图片、音视频等各种非结构化数据逐渐成为需要存储和处理的海量数据的重要组成部分。面向结构化数据存储的关系型数据库已不能满足智能电网大数据快速访问、大规模数据分析的需求。