北极星智能电网在线讯:0引言
近年来,大容量电力电子技术因其主动可控性强、动态响应速度快和能量转换效率高等优点,成为新能源接入[1-2]、高速机车牵引[3-6]、智能输配电[7-8]、工业节能和国防装备中的基础性技术。特别是随着能源互联网战略的提出[9],电力电子与电力系统的深度融合日益成为电气工程领域的研究热点。大容量电力变换系统的功率等级一般在百kW级乃至数十GW级以上,电压等级一般在kV级乃至数百kV级以上,电流等级一般在数百安培级乃至数万安培级以上。大容量电力电子系统的运行环境和运行工况日益复杂,例如在特种电源领域,面临极高温/极低温、强辐射、高压强等极端环境条件,处于电压/电流/功率大波动、规则/非规则的高脉冲功率和周期/非周期性强机械振动等极端运行工况。电力变换装置的可靠性对提高应用系统的综合性能、降低运维成本具有极为重要的作用。相关统计表明,光伏发电系统的计划外检修有37%是由电力电子变换器故障引发[10];在交流变频驱动和风力发电系统中,电力电子装置导致的故障分别占到38%和13%[11-12]。因此,大容量电力电子装置及系统的可靠性日益成为学术界和工业界关注的焦点。
尽管大容量电力电子系统的运行环境和工况日益复杂,但技术、工艺和设计等的不断创新提高了电力电子装置在电-热-机等多重高强度应力下的可靠性。基于50万个高压大容量IGBT模块的统计表明[13],模块的失效率从1995年的1000FITs(1FIT=10-9/(件•h))下降到2000年的20FITs。然而,目前电力电子装置的可靠性与用户的需求仍有较大差距,航空航天、交通牵引、输配电等领域对电力电子装置的故障率期望在10FITs以下[14]。此外,上述对可靠性要求较高的领域往往伴随着复杂的运行工况,为电力电子装置的可靠性设计带来更大挑战。由于电力电子装置是应用系统的动力接口,一旦装置发生故障,将会导致整个系统停运,其运维成本极高、停运损失极大。相关统计表明,有40%以上工业用户因电力电子装置故障造成的损失达到系统总成本的50%以上[14]。
在电力电子装置失效因素中,约50%是由功率半导体器件与印刷电路板(printedcircuitboard,PCB)的故障引发,16%是由电容失效造成,随后依次为母排故障、连接部分故障和控制芯片故障等[15]。以大容量IGBT模块的失效为例,由于模块封装的多层结构及多相异质材料的热膨胀系数不同,在反复热循环冲击下,多层材料内部疲劳损伤积累造成老化,引发铝键合线脱落和焊料层疲劳失效[16-19]。电力电子装置失效的原因可分为外部诱因和内部诱因,其中外部诱因是指过电压、过电流及过热等极端工况导致的短时间尺度的过应力失效;而内部诱因指在电气应力、热应力、辐射等条件下疲劳逐渐累积造成的长时间尺度老化[20],具体如图1所示。
图1电力电子装置失效诱因图
1大容量电力电子系统可靠性研究现状
大容量电力电子系统具有多物理场(电磁场、温度场、应力场等)多环境因素(振动、过热、潮湿、灰尘等)强耦合的运行工况,其故障失效通常是由多种诱因耦合作用所致。因此,对其可靠性的研究具有多学科交叉的特点。纵观学术界和工业界的研究现状,电力电子装置可靠性的研究方法主要包括基于因果模型和基于数据模型两大类:
1)基于因果模型的可靠性研究方法:根据电力电子装置具体元器件(如半导体器件、电容器)老化失效的物理原理,分析装置失效故障的本质机理和因果关系,从而建立电力电子装置的可靠性模型。例如在半导体器件方面,之前的研究针对物理原理通过有限元分析(finiteelementanalysis,FEA)等手段提出了大量可靠性分析模型,如Coffin-Manson模型[21-22],Norris-Landzberg模型[23]及Bayerer模型[24],为器件工作寿命和老化积累的研究提供理论分析。
但是,这种基于因果关系建立可靠性分析模型的研究方法具有较大局限性。首先,随着电力电子装置在新能源并网、电动汽车、电能质量补偿等领域的广泛应用,运行工况日益复杂,意味着通过科学机理对装置可靠性进行全面系统的研究仅存在理论可能。实际模型往往只针对单一因素或单一工况,并存在较多假设和忽略,这使得研究模型与实际工程应用之间严重脱节。
因此,基于因果模型的可靠性研究方法虽然提供了原理层面的阐释,但在多时间尺度多物理场耦合的实际工况下,该方法过于注重对因果关系的科学原理的分析,大大增加了研究周期和复杂程度。
2)基于数据模型的可靠性研究方法:在可靠性领域发展初期,研究人员利用统计学方法建立了众多可靠性分析模型,例如MIL-HDBK-217,PRISM和Telcordia等[25-27]。它们将失效率作为可靠性分析的重要指标,并将装置从出厂到老化失效期间按照失效率划分为3个阶段:早期故障阶段,偶然故障阶段,损耗故障阶段。如图2所示。
在产品投入使用初期,零件不合格、材料不良或者加工转配工艺不好等原因导致故障率较高,随着产品的更换、改进和磨合等,故障率迅速下降。
图2可靠性浴盆曲线图
在偶然故障阶段产品的故障率近似于常数,故障被视为由偶然因素引起的随机事件。在耗损故障阶段,器件老化积累导致故障率迅速升高,产品逐渐发生故障不能继续使用。在整个寿命周期中故障率近似满足统计学中的韦伯分布。
然而,基于统计学原理建立的早期可靠性模型往往只适用于海量样本的随机分析,较多用于产品质量检验。而在实际工程应用中,可靠性研究更多关注有限数量装置的全生命周期管理和老化失效预测,样本数量较少,因此统计模型应用价值较低,尤其是对于单台装置的故障预防和寿命预测存在困难。
近年来,基于数据模型的可靠性研究方法开始关注众多传感器测量得到的装置外部参数之间的关联、聚类、时间序列等关系。这些参数是装置内部机理的外部表征,在多时间尺度多物理场耦合的运行工况下,对于这些参数的研究更加直观。基于数据模型的方法不拘泥于对原理层面的探索,能够充分利用装置历史运行数据库提供的海量信息,因此与实际工业应用结合紧密,研究周期大大缩短。例如,IGBT模块的铝键合线裂纹、脱落会造成相同导通电流Ice和结温Tj情况下饱和压降Uce上升[19],而铜基板与直接覆铜板(directbondedcopper,DBC)之间的焊接层老化会造成热阻的上升[18],因此,通过对Uce和模块热阻的测量数据进行分析,对比它们与正常值的差异可以较准确的评估模块老化程度。这种方式主要建立在数据采集和分析的基础上,充分利用与器件可靠性问题相关的参数,进行数据挖掘以及可靠性信息的提取,而不用过多考虑复杂的器件工作机理和模型,在工程应用中简单易行,实际应用价值较高。
然而,目前该研究方法尚处于初级阶段,采用的数据处理算法仅为相关性分析、回归分析、聚类分析等基础算法,适用于较小的数据样本。而近些年来,随着工业互联网、能源互联网等战略的提出,以及设备监控系统和传感器技术的不断发展,可靠性研究的数据样本将呈现爆炸式增长。融合为计算机、商业、金融业等领域带来颠覆性变革的大数据处理技术,研究基于海量数据的可靠性理论和方法将有可能成为新的热点。借助大数据技术对海量电力电子装置的历史数据库进行处理,通过数据挖掘、关联分析、聚类分析、人工智能、机器学习等先进手段充分挖掘设备可靠性信息,有望为电力电子可靠性研究提供一种通过数据表征间接理解原理本质的研究方法。