再如,需要定量描述投运时间对设备性能的影响。同时,邻近性模型还是进行分类、聚类分析、离群点分析等深入研究的数据基础。
4.3 配电网数据关联模型
关联规则由Agrawal、Imielinski和Swami提出,是数据中一种简单但很实用的规则。配电网故障、状态与原因之间存在关联关系,发现故障属性间的关联特性可以更好地对设备进行故障监测与诊断。
如分析配电网参数和暂态稳定性之间的关联性,判断发生故障时系统失稳的概率;如分析系统节点电压变化特性与故障之间的关系,找出系统中最为敏感的节点;如寻找特定地点谐波电流与其他地点电压之间的关联度,确定谐波源位置、特征及处理方法。
也可在电力营销和负荷管理中引入关联分析,以指导供电公司制定合理的营销策略,如在配网规划中,分析城市用电量与GDP 增长率、第二产业比重、中心性等级、行政级别、气候类型等因素之间的关联关系。
5 配电网大数据分析方法和手段
5.1 配电网数据特征聚类
聚类可用于将数据分割成多个类或子集,在聚类分析中类的数量是未知的。常见的聚类方法有划分聚类法、层次聚类法、网格聚类法、基于模型的聚类法以及智能聚类法等。根据不同聚类方法的适用范围及配电网大数据的特征,通过研究基于配电网时空特性的数据聚类方法,能够提出处理配电网时空特性的数据聚类解决方案。
从配电网调度系统和负荷监测中提取不同区域、不同类型的用户负荷曲线,进行负荷特性聚类分析,为电力公司营销和负荷管理提供依据,是近几年电力系统聚类分析的研究热点。通过对负荷曲线的聚类,可以作为负荷预测和电价预测的预处理过程;通过分析配电网线路和设备故障信息,形成具有相似变化的曲线簇,可更好地估计和抑制故障带来的影响。