5.4 数据密集型计算手段
目前分布式并行计算技术是数据密集型计算的主要手段。由于大数据的数据量和分布式的特点,使得传统的数据管理技术难以胜任这种海量数据。很多企业开始想方设法把大数据存储起来,不断地尝试新的大数据存储架构、研究大数据分析方法技术。
目前,在分布式并行计算与存储的很多研究和应用中,Hadoop的分布式并行处理应用的比较多,比如互联网网页分析和大数据统计挖掘等。电力系统的优化分析方法大多是计算任务/数据密集型的,所以可依靠Hadoop较容易地开展分布式并行方面的计算和研究。
基于Hadoop的分布式并行计算技术在国内电力行业中的应用研究还处于探索阶段,研究内容主要集中在系统构想、实现思路和前景展望等方面。在国外,基于Hadoop的分布式并行计算应用目前已用于海量数据的存储和简单处理,已有实现并运行的实际系统。
分布式并行计算技术能够为大规模复杂配电网分析计算提供强大的支撑,并能为供电企业和用户提供大量的高附加值服务,这些增值服务将有利于电网安全监测与控制(包括故障预警与处理、供电与电力调度决策支持和更准确的用电量预测)、客户用电行为分析与客户细分、电力企业精细化运营管理、更科学的需求侧管理等。
6 结论与展望
随着大数据时代的到来及大数据应用技术的发展,为充分利用现有电网运行数据和气象环境数据进行设备故障预测成为可能。
通过集成各分散系统的信息,规范数据类型,形成丰富的、同质的大数据样本,对不同类型、不同型号、不同状态的设备进行故障发生可能性预测,可为电网运检采取针对性的防护措施提供支撑,为电网安全运行、智能电网自愈提供保障。
电力信息化建设利用大数据技术,在企业数据共享的平台下获取电力企业生产数据、管理数据、地形地貌数据、水资源数据等有效数据,能够提炼准确的、有价值的数据,能够为管理效益、决策能力提升提供有效帮助。
特别是在运行检修基础数据不断积累的前提下,利用大数据分析技术,能对检修工作进行有效预测和数据支持,可进一步提升设备运行管理水平,为运行检修科学决策提供可靠的数据依据,具有巨大的经济价值和社会效益。