AI智能总结
人工智能与先进计算融合创新关键技术与基础支撑体系研究 版权声明 本蓝皮书版权属于编写发布单位,并受法律保护。转载、摘编或通过其他方式使用本蓝皮书文字或者观点应注明“来源:人工智能与先进计算融合创新学术会议暨中国工程院工程科技学术研讨会“生成式变结构计算与高效能先进计算新路径研究”,人工智能与先进计算融合创新关键技术与基础支撑体系研究蓝皮书,2025年8月”。违反上述声明者,版权方将追究其相关法律责任。 编委会主任 邬江兴 编委会(按姓氏笔划排序) 马凯学叶乐石宣化刘勤让李涛汪志强吴华强张帆金海明雪飞窦强梁新夫韩银和薛向阳邹宏 编写人员(按姓氏笔划排序) 王钧彝王颖王刚冯枫冯丹朱丹江刘强刘丰满许志伟祁晓峰余杰余新胜吴庆波张庆东陈艇陈曦范旺尚玉婷胡杨胡宇翔胡小燕贺明赵豪兵查雨立夏于桐郭国平郭威高彦钊曹伟梁新夫彭聪廖小飞潘纲 人工智能与先进计算融合创新关键技术与基础支撑体系研究 当前,人工智能与先进计算的融合创新正迎来关键历史机遇——国家深入推进“人工智能+”行动、加速人工智能规模化商业化应用,巨量场景对算力提出“高智能、低时延、零信任”的极致需求。达成这一需求,亟须突破传统计算困局。晶上生成式变结构计算为人工智能与先进计算 (AI2AC) 融合创新提供了全新路径。在关键技术层面,晶上生成式变结构计算通过动态重构硬件资源与任务的映射关系,以“结构内生多样性”化解“应用需求多样性”矛盾;软件定义互连打破协议与拓扑的刚性约束,构建“协议可编程、带宽可定义”的柔性连接网络;晶圆级封装 (SDSoW) 突破单一制程限制,在28nm工艺下实现算力密度较传统方案提升3个数量级,为变结构计算提供高密度物理基座。在支撑体系层面,超融合算力网络环境为大规模算力优化提供了关键支撑;AI计算内生安全通过化解大模型对抗攻击、数据投毒等未知风险,实现安全与效能的协同演进;算能一体化通过新能源波动性与算力负载的精准匹配,大幅提升绿电利用率,为算力基础设施注入可持续动能。人工智能与先进计算的深度融合,将推动计算范式从“工具赋能”向“体系重构”跃迁,最终实现“智能驱动决策、安全融入基因、能效突破极限”的终极目标,为全球数字经济打造高可靠、高可信、高效能的智能底座。 C O N T E N T S1.1生成式变结构计算的架构设计..........................................................11.2领域专用基础算核库生成..................................................................31.3全栈式软件工具链设计.....................................................................5 第二章软件定义互连...............................................................8 2.1软件定义互连 (SDI) 概述...................................................................82.2SDI改变刚性计算结构瓶颈................................................................112.3生成式复杂网络的构建方法..............................................................122.4SDI与变结构计算的协同演进............................................................14 第三章晶圆级封装与物理实现.................................................16 3.1先进封装进展....................................................................................163.2生成式结构计算的工程物理特征.......................................................19 第四章超融合算力网络环境....................................................22 4.1算力网络发展面临的挑战..................................................................224.2超融合算力网络环境概述..................................................................254.3超融合算力网络环境的关键技术.......................................................284.4发展愿景展望....................................................................................31 第五章AI计算应用系统内生安全.............................................34 5.1内生安全:先进计算范式的“免疫基因”.............................................345.2AI驱动:内生安全架构的“智能进化引擎”...........................................365.3安全筑基:AI可信应用的“保障体系”..................................................39 第六章智能调度高效柔性负荷微网能源系统..........................44 6.1AI算力激增与新能源波动性挑战.......................................................446.2EFLM解决算力与多能电源时空耦合问题...........................................466.3AI驱动构建EFLM“动态优化大脑”.....................................................496.4能算结合实现AI可持续发展..............................................................50 参考文献.....................................................................................52 第一章 生成式变结构计算 近年来,人工智能推动领域专用计算体系结构迅速发展。受应用任务变化、制程工艺进步及设计思想演进等因素推动,计算系统设计不断发展,但现有体系架构如通用计算、专用集成电路、异构计算和可重构计算等均存在一定缺陷。为解决这些问题,通过动态重构硬件资源与计算任务的映射关系,以“结构内生多样性”应对“应用变化多样性”,推动计算系统从“固定架构适配任务”向“动态架构响应需求”转型,实现硬件资源与计算需求的实时适配,进而支撑大规模智能计算,实现智能、高效、绿色和经济的生成式变结构计算系统。 1.1生成式变结构计算的架构设计 1.1.1理论模型 计算架构的固定性无法满足不同场景下的多样化需求,导致在性能、效能和灵活性上无法同时达到最佳。如图1所示,优化一个或两个方面通常难以兼顾第三个方面,而设计一个全面优秀的计算架构极其复杂,本文称之为“EPF困境”。计算系统无论是采用虚拟化方案还是众核方案,都无法解决多样性的算力需求。要打破EPF困境,必须超越现有架构,寻找新的计算范式。这是推动计算技术持续发展的关键。 任何单一的计算体系架构在EPF三维都无法在应用场景多样化条件下实现优化能力。在问题的原有维度上无法求解时,生成式变结构计算通过增加时间维度进行求解,即在EPFT四维上实现先 为如公式 (1) 所示。 进计算系统的优化。 对软硬件资源的元素化抽象处理是构建高效、灵活计算体系结构的关键。通过动态定义方式,如编排、调度等,在EPFT四维创建多样化不完全交集。这些交集在计算体系结构全生命周期中,通过动态调整和优化,形成EPF完备交集。计算体系结构的创建和演进过程,实质是元素化资源的可编程构建或释放回收过程,涉及资源动态分配管理及计算任务的高效响应处理。 其中,t为时间,N为计算体系结构序号,s为在计算体系结构时的任务序号,A,B,C为不同类型的计算资源。在EPFT四维,不同时段计算体系结构所需计算资源的类型、数量、形态会根据系统服务质量评估结果发生动态变化,计算资源的“聚合”方式也应随之动态改变,引起资源的重构。记t时刻重构方法为Lt,服务质量的评估方法为St,则从时刻ti到时刻tj,重构方法动态变化函数如公式 (2) 和公式 (3) 所示。 在EPFT四维的“微分”时段,若能一体化展现多种任务的最优计算体系结构,那么在“积分”区间,我们就能等效地获得EPF完备交集。系统在极短时间间隔上迅速适应,优化计算资源分配,满足不同任务需求。生成式变结构计算需支持多种体系结构共存及多样化应用场景的演进,要求计算体系结构具有高度灵活性和可扩展性。这样,我们能构建出高效且可持续的计算生态系统,为未来信息技术应用打下坚实基础。 生成式变结构计算的关键是软硬件资源向确定性任务映射的共享表达方式。如图2所示,在EPFT时空上实现EPF完备交集时,不同的计算体系结构应具有不同的软硬件资源映射方式,将计算资源元素化表达 生成式变结构计算整合了资源和互连结构,通过分类应用需求并映射至特定领域,提炼形成软件定义节 点。这种互连结构为应用开发和部署提供框架支持,实现多节点协同作业,满足多样化计算和网络服务需求。资源动态聚合与分散,提高利用率,降低成本,增强系统性能和稳定性。 资源池化聚合的支持上,还在于它能够通过智能算法和先进的管理技术,将计算资源、存储资源以及网络资源进行高效整合和池化管理。这种整合使得系统能够实现资源的动态分配和优化组合,从而达到系统性能的最优化。通过这种方式,资源池化聚合显著提高了资源的利用效率,同时为系统的可扩展性和可维护性提供了有力的保障。在面对不断变化的工作负载和业务需求时,计算系统能够快速响应,灵活调整资源分配策略,以适应新的挑战和需求。这种灵活性确保了系统能够持续提供高效的服务,同时也为未来技术的发展和升级预留了空间。 1.1.2系统框架 构建生成式变结构计算系统遵循“计算模式元素化、资源动态聚合”的核心原则。该原则意味着将复杂的计算模式拆解为更微小、更易于管理的元素,此举不仅有助于简化复杂的计算模式,而且显著提升了系统的灵活性,使得这些元素能够更加便捷地进行组合与调度。进一步地,资源的动态聚合策略允许我们依据实际需求灵活地组合与分配资源,从而显著提升了资源的利用率,并且能够更好地适应工作负载的动态变化。通过采用生成式互连结构,能够满足各种计算任务的需求,实现资源的高效调度与优化,进而促进互连体制的共生,确保整个计算系统的高效、稳定运行。 1.2领域专用基础算核库生成 领域专用基础算核库是构建生成式变结构计算系统的基础。确定目标服务领域后,需分析并提取共性算子,通过融合这些算子,实现不同粒度的算核,建立领域算核库。 生成式变结构计算设计根据应用需求动态生成和调整互连结构,具有动态性和可重构性,提供灵活性以适应多种计算任务。关键在于运用可重构和虚拟化技术,使系统能自我调整