您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [华中科技大学强电磁技术全国重点实验室]:面向电力系统继电保护整定计算的极端运行方式智能搜索 - 发现报告

面向电力系统继电保护整定计算的极端运行方式智能搜索

报告封面

报告人:王镜毓 华中科技大学强电磁技术全国重点实验室jywang@hust.edu.cn 2026年4月24日 目录 01研究背景与意义 02基于深度学习的直接映射式极端运行方式搜索方法03基于图强化学习的序贯决策式极端运行方式搜索方法04基于图迁移学习的可泛化极端运行方式搜索方法05总结与展望 1.1 研究背景 极端运行方式整定计算中必须考虑各种 口保护定值在较长时间内保持不变&电力系统运行方式不断变化口为使保护装置在不同系统运行方式下都能正确动作,整定计算时必须考虑极端运行方式瞬时过流保护整定原则:按躲过本线路未端最大短路电流整定口快速、准确识别极端运行方式对保护整定计算至关重要 Iop = K.IBmaxK:可靠系数,一般取1.2~1.3Iomax:本线末端故障最大三相短路电流值 1.1研究背景 新型电力系统发展给继电保护整定计算带来严峻挑战 电网结构持续扩张,极端运行方式的搜索空间急剧增长,传统枚举式搜索方法效率降低 口为适应新能源/负荷随机性,电力系统运行方式更加灵活,难以定义基本运行方式 与传统电网在短路计算中视为空载网络不同,新能源机组通常采用非线性压控电流源模型,短路电流需要选代求解,进一步增加搜索时间 1.2国内外研究现状 保护整定中极端运行方式搜索方法的研究现状: 仍属于局部枚举法范畴,搜索过程需重复进行大量的元件方式组合与短路计算。 划定搜索区域时,采用的判据/门槛值仍依赖人工经验,如何保证搜索精度&搜索效率平衡的研究较少。 口电源影响域法,仅适用于辐射型网络口扰动域法,计算量大口电源贡献系数->电源运行方式口紧邻集法,未解决线路方式对Ilk的影响口遗传算法->极端厂站组合方法口故障特征提取->直流差动保护口虚拟支路法,门槛值设定缺乏理论依据口快速凸包算法->裕度、爬坡、传输安全 人工智能技术在电力系统中的应用与研究现状: 强化学习、深度学习、迁移学习、图神经网络…………;最优潮流、稳定评估、功率预测、信息安全·………口深度学习训练需要海量样本支撑,在极端运行方式搜索问题中,通过枚举法生成样本的时间成本极高口强化学习训练依赖大量随机探索,极端运行方式搜索空间庞大,训练效率与收敛性难以保证口电力系统网架结构持续扩张,保持模型的泛化能力是方法实用化的关键5 1.3总体方案 极端运行方式搜索本质是高维离散空间组合优化问题一一探索基于人工智能技术的搜索新范式 >深度学习、图神经网络 口迁移学习 >强化学习 ·环境+智能体一→累计奖励最大化解决高维离散空间最优搜索问题的有效方法离线训练后,在线寻优速度快 继承原任务的神经网络参数,冻结神经网络靠前的特征提取层用少量新任务下的样本训练靠后的输出层,达到快速适应新任务的目的 聚合相邻节点特征,使信息沿网络拓扑传递适用于处理电力系统等本征具备图结构系统的学习问题 半监督训练,减少对训练样本的依赖 模型参数动态自适应,增强泛化性 目录 01研究背景与意义 02基于深度学习的直接映射式极端运行方式搜索方法03基于图强化学习的序贯决策式极端运行方式搜索方法04基于图迁移学习的可泛化极端运行方式搜索方法05总结与展望 2.基于深度学习的直接映射式极端运行方式搜索方法 2.1瞬时过流保护极端运行方式搜索问题的数学建模 目标函数:最大化短路电流 问题描述:在系统初始运行方式TO下,寻找当待整定保护p所在线路的末端发生三相短路故障时,使得流过经路首端保护的短路电流最大的系统中所有线路的投/停状态组合,就是该保护的极端运行方式T。 约束条件: E.Es短路电流分布:X,+XkX, +X.lPT= 1.2 ~ 1.3整定公式:动作判据: 2.基于深度学习的直接映射式极端运行方式搜索方法 电气距离矩阵Dz:电气距离矩阵包含电网中各母线之间的电气距离信息,由互阻抗衡量。 元件参数矩阵P:元件参数矩阵包含电力元件类型与元件参数信息。 拓扑矩阵T:拓扑结构矩阵包含电网中各母线间的连接关系和保护所在位置信息。 图距离矩阵D:图距离矩阵包含图结构中所有节点两两之间的最短距离信息。 2.基于深度学习的直接映射式极端运行方式搜索方法 2.3基于并行图神经网络的极端运行方式搜索框架-并行图神经网络 图卷积神经网络: GraphSAGE神经网络: 图神经网络: 口聚合邻居节点信息以更新本节点的特征向量,使得信息传递口叠加多层,增加感受野口基于邻接矩阵卷积,更适用于电力系统问题 2.基于深度学习的直接映射式极端运行方式搜索方法 2.3基于并行图神经网络的极端运行方式搜索框架 元件参数矩阵P:元件参数矩阵包含电力元件类型与元件参数信息。 充分考虑了新能源的非线性压控电流源特性: 口特征编码:在特征矩阵中做特殊编码。 口样本生成:在生成训练样本时,计及新能源的非线性 压控电流源特性,通过迭代计算得到短路电流。 2.基于深度学习的直接映射式极端运行方式搜索方法 输入:四个特征矩阵P、T、DZ、D 输出:极端运行方式向量 神经网络结构:由电力系统配置决定,GNN中节点个数与电力系统中节点个数相同;决策网络输出维度与电力系统中线路条数相同。 训练与测试:有监督训练;二元交叉损失函数;由枚举法生成样本数据。 2.基于深度学习的直接映射式极端运行式搜索方法 2.4算例分析-评价指标 口运行方式准确率OC-Acc:在若干个随机初始状态下,并行图神经网络输出的极端运行方式与根据全局枚举法得到的结果完全相同的占比。 口短路电流准确率SCC-Acc:在若干个随机初始状态下,并行图神经网络输出极端运行方式下的短路电流与根据全局枚举法得到的最大短路电流完全相等的占比。 口容差短路电流准确率e-SCC-Acc:在若干个随机初始状态下,并行图神经网络输出极端运行方式下的短路电流与根据全局枚举法得到的最大短路电流误差在e范围内的占比 口保护选择性准确率PS-Acc:在若干个随机初始状态下,并行图神经网络计算的短路电流满足保护选择性判据的占比。 2.基于深度学习的直接映射式极端运行方式搜索方法 2.基于深度学习的直接映射式极端运行方式搜索方法 2.基于深度学习的直接映射式极端运行方式搜索方法 2.4算例分析-扩展性实验 口大电网实验:包含2414个节点、260台发电机、764条线路和2074台双绕组变压器。 目录 01研究背景与意义02基于深度学习的直接映射式极端运行方式搜索方法03基于图强化学习的序贯决策式极端运行方式搜索方法04基于图迁移学习的可泛化极端运行方式搜索方法05总结与展望 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.1直接映射式搜索方法的挑战 强化学习 环境+智能体一→累计奖励最大化解决高维离散空间最优搜索问题的有效方法离线训练后,在线寻优速度快 口并行图神经网络的缺陷:训练高度依赖于大 规模、高质量的枚举样本。在极端运行方式 搜索问题中,样本基于枚举法生成,获取足 量的枚举样本需要进行大量元件方式组合与 半监督训练,减少对训练样本的依赖 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.2强化学习基本原理 略网络的参数,从而逐渐达到目标。 D3QN算法是一种基于价值的强化学习算法,引入了Dueling和Double两种改进措施。 口序贯决策过程:状态一→动作→奖励→状态一→ 表现优异。61 最优策略使得价值最大。 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.2GraphD3QN算法框架 目标函数:最大化短路电流 问题描述:在系统初始运行方式t0下,寻找当待整定保护p所在线路的末端发生三相短路故障f时,使得流过线路首端保护的短路电流最大的系统中所有线路的投/停状态组合,就是该保护的极端运行方式。 建立强化学习模型: 口环境:短路电流求解器 口智能体:Graph D3QN神经网络→ GNN提取系统特征,D3QN决策极端运行方式 口状态:四个特征矩阵P、T、DZ、D 口动作:停运一条线路,或保持运行方式不变 口奖励:动作前后的故障电流差值 * Y. Li, J.Wang, et al., Efficient Searching of Extreme Operating Conditions for Relay Protection Setting Calculation Based onGraphReinforcementLearning,ExpertSystemsWithApplications,vol.2026,p.132210,2026 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.2Graph D3QN算法框架 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.3引导学习-自由探索的两阶段、半监督训练框架 引导学习+自由探索 口引导网络训练:有监督训练,通过枚举法获得少量《初始运行方式,极端运行方式》键值对,有监督训练引导网络 口目的:尽可能降低强化学习模型对无效/错误动作的探索轮次,同时提升训练与收敛稳定性 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.4算例分析-测试场景 实际整定时,通常需要求解系统在某个初始运行方式下所有保护的极端运行方式 价值网络计算的极端短路电流与枚举法计算的极端短路电流,得出准确率。 路电流,比较价值网络与枚举法的计算结果,得出准确率。 结束后使用,作为对场景1的补充。 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.基于图强化学习的序贯决策式极端运行方式搜索方法 3.基于图强化学习的序贯决策式极端运行方式搜索方法 口GraphD3QN准确率高于CNND3QN、MLPD3QN,证明图神经网络在解决极端运行方式搜索问题时更有效口 Graph D3QN准确率高于GNN、CNN、MLP,证明了引导学习-自由探索训练框架的有效性口与并行图神经网络方法相比,GraphD3QN所需训练样本数减少一半(10000→5000),生成样本时间节省>5h 27 目录 01研究背景与意义02基于深度学习的直接映射式极端运行方式搜索方法03基于图强化学习的序贯决策式极端运行方式搜索方法0405总结与展望 4.基于迁移学习的可泛化极端运行方式搜索方法 4.1模型泛化能力存在的挑战 》迁移学习 口并行图神经网络与GraphD3QN的缺陷: 继承原任务的神经网络参数,冻结神经网络靠前的特征提取层用少量新任务下的样本训练靠后的输出层,达到快速适应新任务的目的 神经网络结构参数与电力系统大小耦合,所 训练的神经网络仅适用于当前系统。当电力 系统中新增母线等元件后,原有的神经网络 便不再适用,需要进行重新训练。需提升神 模型参数动态自适应,增强泛化性 4.基于迁移学习的可泛化极端运行方式搜索方法 4.2自信息与互信息结合的特征提取器:特征提取得到线路特征 改进思路: 重构编码、解码过程,将神经网络大小与电力系统大小解耦,可适应电力系统一定程度的变化;验证模型泛化能力 通过自/互信息编码与特征提取方式将特征提取器结构与电力系统大小解耦 互信息(4项): 自信息(9项): 》线路阻抗Z、度>线路运行状态(是否为保护所在线路pro)>两侧节点类型、距离故障节点的电气距离》支路末端是否故障>支路类型 》两条线路的连接方式》是否为故障处:0/1故障节点/-1保护节点》线路首末节点与故障点的电气距离》相连的这个支路的类型 4.基于迁移学习的可泛化极端运行方式搜索方法 4.2基于图神经网络的特征聚合器:图卷积得到高维特征 改进思路: 重构编码、解码过程,将神经网络大小与电力系统大小解耦,可适应电力系统一定程度的变化;验证模型泛化能力 图神经网络结构与节点数量无关,与电力系统大小解耦 决策网络通常为MLP,为了解耦决策网络与