AI智能总结
报告人:赵俊华单位:香港中文大学(深圳)时间:2025年10月26日 01大语言模型与智能体技术简介 Agent(自主智能体)考古学:通用定义 自主智能体 典型实例 EmbodiedQA,FAIR,2018 能够自动感知环境能够在环境中自主行动能够通过环境反馈自主学习 LLMAgent:关键能力一使用工具 常用工具: LLMAgent:关键能力一任务分解与试错 TrialandError LLMAgent:关键能力一Long-termMemory Long-termMemory与RAG区别:可读写性 与HumanBrainMapping: LLMAgent:关键能力一自主学习 Fine-tuningmodelweights(themostobvious)FireAct Optimizingpromptsacrosstasks-LLMare Improvetheagentsowncodebase-SwE-agent Reflextion Combinemultipleapproaches Fine-Tuning and Prompt Optimization:TwoGreatStepsthatWorkBetterTogether Dilara Soylu Christopher Potts Omar Khattab 02LLMAgents在电力系统研究中的应用思考 大模型的核心能力 LLMAgent在新型电力系统中的应用思考 LLMAgent的潜在应用领域: ·机器代人(机巡、客服、公文写作等·工作流重构(调度运行规划)·信息-物理-社会系统(CPSSE)仿真:多模态数据融合(数学化服务):电力系统机理研究(AI4S) 。在调度运行等核心领域,大模型的推理可靠性与“幻觉”问题,决定了天模型尚不能完全替代人工。·已经应用良好的各种基于因果模型的工具无需替代。·可以考虑来取因果模型+大模型+符号串模型(SPT)+小模型融合的技术路线。 薛禹胜,新型能源体系(CPSS-EEE)的多目标协调规划,https://mp.weixin.qq.com/s/fodienZxB24j9MRX6qFa9w赵俊华,文福拴,黄建伟,等,基于大语言模型的电力系统通用人工智能展望:理论与应用[J,电力系统自动化,2024,48(6):13-28 在Agent的框架下实现多类模型的融合 在Agent的框架下实现多类模型的融合 ,推理大模型作为“大脑”,主要负责问题的规划、任务的分解与高层次推理·PINN可在尽量保留因果模型准确性的前提下,大幅提高计算速度;:因果模型可在部分必要场景下,保证决策结果的可靠性;:符号模型可以在推理中提取形式化知识,保证智能体整体框架的可解释性; 在Agent的框架下实现多类模型的融合 ,必要的场景中,可以将人引入多智能体框架中;:人可以向智能体提供反馈,并作为最终决策者判定决策质量;:决定人什么时候介入是一个待解决的课题: 【人机协同】新范式与参考架构 人机协同理念与模式 技术架构图 执行与门控层指令生成、人类审批、流程审计 核心理念:“人类价值与问责为核心,AI的速度与规模为引掌”逐步实现“例行自动一异常监督一危机协同”的运行范式。 构建“感知-认知-推演-编排-执行”的全链路协同闭环,让人类专家聚焦于高价值的决策、监督与异常处置。 03LLMAgents的应用初探 基于大语言模型实现高适应性负荷预测(多模态数据融合) 传统方法局限:1.难以应对特殊事件发生时,短期电力负荷的快速变化或极端波动;2.不能适应超出历史数据涵盖范围的新场景;3.无法基于文本数据(新闻事件)进行预测推理。 提出lntelligentText-AnalyticLoadForecastingITA-LF):LLM能够基于语言有效处理、整合非结构化及海量多源数据,通过Agent筛选实时相关新闻并理解文本逻辑,显著提升预测的适应性和精确度。 ITA-LF框架图 基于大语言模型实现高适应性负荷预测 基于新闻和负荷数据的ITA-LF预测效果普遍优于现有方法: 基于大语言模型实现高适应性负荷预测 预测效果普遍优于现有方法,在不同时间和地理维度的适应性强,显著提升预测的适应性和精确度: 基于LLM的负荷预测显著提升准确性和可靠性,优化对突发变化的应对,突出了语言处理在整合非结构化信息中的作用,标志负荷预测及时序决策研究范式的转变 新型电力系统下调度运行面临的挑战 随着新型电力系统建设与电力现货市场改革的深入,当前广东省调度运行面临控制对象快速增加、运行场景灵活多变、市场合规运营压力增大的痛点,传统调度依靠人工进行大量数据分析并且依靠经验进行调度的模式已不能满足系统运行需要,驱需开展智能化升级。 “AI+电力调度”可面临的挑战 电力调度业务具有专业性强、安全第一、快速响应和综合全面的特点,给电力调度的A/+转型带来了巨大挑战。 通用大模型训练数据缺少调度专业知识 “AI+电力调度”可面临的挑战 电力调度业务具有专业性强、安全第一、快速响应和综合全面的特点,给电力调度的A/+转型带来了巨大挑战。 多方信息在调度汇集 调度大模型研究背景 基于前期研究,我们发现可以将调度、市场行为以大语言模型的形式建模(语言模型化),解决传统调度支撑体系中调度行为没有有效建模工具的问题。我们希望实现调度行为数据(包含语音、拓扑结构、文本等多模态数据)、调度规程及系统工况等数据的统一表示,基于大语言模型多智能体实现调度行为的理解、推理、操作序列生成、智能博奔策略生成、市场波动响应及决策优化等目标,提高调度安全性与效率。 调度大模型数据处理 调度大模型交互页面 初版领域数据集 教材,论文集,章程等调度场景数据等 大模型训练数据集 业务场景支持: 领域对话问答数据集 经济调度操作监护黑启动 调度大模型评价指标 测试集评测体系: 评测围绕调度大模型在事实性、逻辑性、稳定性、公平性、安全性、表达能力六大类二十四个子维度展开评估。 测试集题型设定: 客观题:判断题、选择题、问答题主观题:问答题 评测方法: 客观题:GPT-4+评测脚本主观题:GPT-4+人工评测 推动A/与调度运行深度融合 研究人工智能在调度运行领域垂直落地技术路线,提出多智能体协同、大小模型协同的架构,消除 问答智能体 梳理7大类、近300份调度专业文件,切片形成23万条向量化调度知识库,通过检索增强技术赋予大模型专业知识理解能力,帮助调度员实现海量调度知识一键归纳整合。 构建本地向量化调度知识库 口分类树口【1】国家法律、法规、条例、标准19个文件口【2】南方电网各级规章、制度,指导160个文件口【3】调度台常用资料81个文件口【4】专业知识拓展库15个文件口【5]广东电网汇报材料5个文件口【6】部门运行工作要求1个文件口【7]台账5个文件 可答智能体:智能体一键归纳整合业务知识 问数智能体 对海量运行数据开展筛查清洗,形成16万+“表名-域名-别名”数据标签,构建知识图谱描述多源数据内在联系,创新性提出“数据查询与计算”独立框架,大幅提升AI对专业数据的检索、理解与计算能力。 报送智能体 基于问答与问数智能体,研发报送智能体,可自动生成报送15种报表,覆盖各调度岗位,将原本数小时才能完成的重复性报表工作缩短为秒级,减负成效明显,并形成易复制易推广的DIY人工智能使用模式。 语音智能体 建立了大模型运用调度专用电话的能力,已在三险联动、告警信号处置、智能安监场景中广泛应用。对于广东电网27个高风险厂站作业,智能体结合调度检修数据智能识别并且通知现场运行人员及工作负责人,刚性传递电网风险。 安监智能体 针对调度业务点多面广的特点,研发了利用多模态信息的安监智能体。目前已初步建立对调度电话业务的监护能力后续将持续对调度挂牌、调度日志、复杂的启动方案、断面调控等多模态的调度行为构建安全监护能力。 操作智能体 建立了“数据系统-填票人系统-审票人系统”强化学习训练框架,全面梳理调度规程及调度员拟票经验并量化形成统一指标,通过24小时不间断练习提升AI对拟票规则理解能力,形成“拟票-下令-操作”全链条智能执行。 规则+经验集构建 决策智能体 通过系统拓扑图谱化构建,赋予A/电网拓扑理解能力,逐步训练事故处置经验,充分发挥多模态信息理解能力,能够秒级完成电网风险分析、生成处置方案,同时自主完成操作票生成、操作执行、信息报送,事故处置全链条时间由小时级缩短至分钟级,相比传统依靠人工提取大量数据信息进行处置的模式更高效、更安全。 明月的应用树立了“数据+经验+AI”的智能调度模式,重构了调度业务形态,改变了调度运行生产方式,提高了调度对新型电力系统驾驭能力,大幅增加了省地调度台业务承载水平,让调度员将更多的精力投入到守护大电网安全中。 市场仿真-大模型经济学仿真的潜力 推理能力:LLMs拥有处理复杂问题和理解复杂语境的能力,这使它们能够理解和分析复杂的博奔策略 泛化能力:得益于LLM出色的zeroshot能力,1快速适应市场的动态变化结合大量历史案例,提高仿真的准确性和效率。 代理模拟:将LLM与多代理仿真结合通过模拟市场中player行为或策略,为市场仿真提供了一种新的思路。 研究进展 背景回顾 基于大语言模型的市场仿真一般性结构框图 市场仿真基础单元:市场主体、市场环境和规则、市场外部性。 在电力市场中,分别对应:“网源荷储”主体和监管主体、电力系统和市场规则、系统和市场外部扰动。 大模型技术应用:直接交易决策建模、市场规则辅助建模、外部扰动参数生成。 大语言模型在日前市场交易行为建模的应用 基于大语言模型的电力现货和备用市场仿真建模-提示词工程 >提示词工程(PromptEngineering):模拟电力交易员工作环境,给出机组工况、断面阻塞、燃料成本、碳成本、系统运行情况等模式化提示语,引导LLM思考方向做更深度逐步推理; ①标准Prompt让LLM直接根据提示生成结果。可解释性较差,易产生幻觉②思维链(ChainofThoughts,CoT)要求LLM生成一步步的推理结果。可解释性强,准确率较高③思维树(TreeofThoughts,ToT)要求LLM对任务进行分解,分解后每个节点送代执行。输出推理过程更全,准确率高 大语言模型在日前市场交易行为建模的应用 基于大语言模型的电力现货和备用市场仿真建模-RAG技术 检素增强生成(Retrieval-AugmentedGeneration,RAG)可适配、理解现货和备用市场相关论文、政策文件、国内外市场研报、仿真模型数据、市场运行数据、系统工况数据等多场景多模态数据,LLM无需增量训练即可初步理解应用领域知识。 RAG标准流程 1.解析:文档PDF解析、按照语义切分为文本块;2.向量化:文本块向量化并存储至向量数据库;3.提问与检索:提交问题,根据提问与文本块的相似度匹配与检索排序;4.生成回复:加载构建提示词,对LLM进行提问,LLM根据召回文本块与问题进行回复; RAG解决LLM限制: 无法处理长文本:知识库有100篇文献幻觉,胡乱回答:LLM没有严格工具最新公示计算39动态知识:最新的新闻无法回答 大语言模型在日前市场交易行为建模的应用 基于大语言模型的电力现货和备用市场仿真建模-专家混合MoE模型集群 专家混合(MixtureofExperts,MoE)大模型集群,针对不同市场主体训练不同的决策大模型并通过门控单元与路由单元进行选择最适合的大模型进行推理; 基础模型通过思维链进行子任务分解,生成模型工具调用链;专业模型通过调用工具、查询历史数据等输出;基础模型整合信息生成最终回复;业务变更时只需更新子模型,基础模型无需更新: 大语言模型在日前市场交易行为建模的应用 基于思维树(Tree-of-Thought)市场自动建模与仿真