您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[工业互联网产业联盟]:工业大模型技术应用与发展报告1.0 - 发现报告

工业大模型技术应用与发展报告1.0

工业大模型技术应用与发展报告1.0

编写单位(排名不分先后) 牵头编写单位:中国信息通信研究院 参与编写单位: 百度在线网络技术(北京)有限公司羚羊工业互联网股份有限公司创新奇智科技集团股份有限公司智昌科技集团股份有限公司中国科学院自动化研究所中工互联北京科技集团有限公司西门子股份公司航天云网科技发展有限责任公司威派格智慧水务股份有限公司卡奥斯COSMOPlat阿里云计算有限公司腾讯计算机系统有限公司 中科云谷科技有限公司浪潮集团有限公司中科视语科技有限公司苏州海赛人工智能有限公司北京通用AI研究院树根互联股份有限公司华为技术有限公司美云智数科技有限公司 1.1大模型成为通用AI新范式,引发工业应用变革讨论 大模型+大数据+大算力成为发展主旋律(ChatGPT) 引发产业领域应用的热烈讨论与憧憬 AI产品渗透速度全球排名第2 干亿参数基础模型 产业应用场景成为大模型最佳“练兵场”——科技日报 GPT-1 : 1.17亿GPT-2:15亿GPT-3:1750亿GPT=4:1.48万亿...... AI大模型落地背后,正带来一场智能制造的系统重构——百度 TB级数据 超3000亿单词830GB代码数据1000个外包团队标注 E级智能超算总算力 超195PFlops我国最快超算“神威·太湖之光”1.7倍 1.2工业大模型与专用小模型成为工业AI发展的两条协同路径 工业大模型=工业+大模型 工业大模型Transformer结构 满足大模型技术基本特征 新场景:代码生成、CAD生成等新应用… 特定任务:点状场景应用效果更好 Transformer为基础框架在大量通用数据上进行预先训练,以实现良好的通用性模型参数一般达十亿以上(最大模型参数已达万亿级) 2具备在工业各环节进行应用的能力,或与工业装备软件等融合赋能 模型更新快:参数量少,可进行快速迭代轻量化部署:所需存储空间和算力更小 低成本运维:低成本开发+维护 1.3大模型初步形成赋能工业的核心方式与产品形态 外挂插件工具 工业管理软件企业Authentise推出插件,用户可查询最大的增材制造知识库浙大开发用于表格处理的TableGPT 2.1大模型赋能工业领域的适用边界与核心能力 大场景 大语料 工业场景的基础数据/语料/规则约束充足 问题边界清晰 结果存在于封闭信息环境,不依赖语料外的信息 2.2应用总体视图:4类核心模型、15+应用场景,目前处于初步探索阶段 工业各环节围绕语言、专用、多模态和视觉四类大模型开展探索当前以大语言模型为主,4类模型应用占比:75%、15%、8%和2%通用模型的场景化适配调优是主要部署方式,问答交互为主要应用模式 2.2(1)大语言模型:主要应用于工业问答交互、内容生成,以提升任务处理效率为主,暂未触及工业核心环节 有望形成具有认知智能的数字员工及超级自动化链路,实现从需求理解到规划、自动化执行及结果交付的全链条能力 2.2(2)专业任务大模型:围绕研发形成辅助设计、药物研发两个重点方向,进一步增强研发模式的创新能力 面向工业设计、蛋白质结构预测及药物研发创新等场景,扩展创新边界、降低创新成本与时间 2.2(3)多模态大模型与视觉大模型:在装备智能化和视觉识别领域应用获得初步尝试 结合视频、语义、执行等多类型数据综合分析,有望构建认知能力的装备、系统方案及智能工厂 3技术体系:大模型是工业AI深度学习路径的深化与拓展 3.1算力:工业领域大模型推理速度为需求关键,未来有望向端/边缘侧推理发展 工业大模型推理速度需满足工业应用及峰值QPS等需求 大模型训练推理算力需求相对可控1 工业领域(边端侧)对推理计算速度及满足峰值QPS等需求较大, 大模型每10亿参数(1G模型文件)所需最低显存需求 百亿参数大模型,使用1张英伟达A100GPU进行推理,每秒生成的token数大约为60已有大模型一体机及端侧优化芯片,实现推理加速 联合华为发布星火一体机,提供2.5P算力 爱 芯 元智-AX650N芯 片,可达361FPS 西工大:基于大模型的多设备协同,采用云端统一控制,需求为单卡4090 工业算力智能分配可能成为关键 云端大算力和终端小算力的平衡使算力分配和性能达到最优 3.2数据:海量高质工业数据/语料库将成为落地部署的关键要素 3.3工具链+模型:低门槛开发和轻量化部署成为工业大模型探索重点 各主体围绕通用大模型开发到部署全流程工具链,多推理后端兼容、半自动微调成为重点 与多推理后端兼容,实现工业低成本迁移 •飞桨通过标准化部署接口,实现不同推理后端的零成本迁移•兼容20余家芯片厂商硬件设备,实现云边端全场景协同 模型压缩 模型增强 在相同的带标签数据集上指导子模型训练,形成高效小规模网络 利用其它数据资源或优化策略(相互学习等)提高子模型性能 数据、算法要求较高,尚无工业实例 对开源大模型进行蒸馏+预 训练+指 令 微调,形成工业大模型AInno-15B(150亿参数) 3.4基础模型:通用大模型的快速演进和专用大模型的能力升级 面向更多样数据类型、更强综合能力的大模型技术迭代创新,为工业领域应用创造更大前景 专业任务大模型的数字支撑能力提升是主要方向,在药物创新发现与产品设计形成初步成果 1、时序数据大模型有望最大化利用海量工业设备与过程数据,赋能流程优化、设备诊断和异常识别 1、依托大规模结构化专业数据嵌入表示能力,训练数据样本的全面性是提升模型性能核心 2、由一维序列、二维拓扑图转向三维表征的先进表征技术是探索方向 训练:超1000亿个时序数据点测试:超30万个时序数据集,开展时、日、周、月的预测评估 2、多模态能力持续创新,加速实现工业图像几何、机理、文档等各类数据模型的综合感知和认知推理 GPT-4.5融合了处理3D模型和视频的能力 深势科技发布Uni-Mol,直接将分子三维结构坐标信息作为模型输入输出 3.5大模型+工业知识图谱:大模型可能对通用知识图谱产生一定冲击,但与领域知识图谱将融合共生,工业领域暂未出现典型探索 3.6应用部署:三类核心部署方式,当前以通用模型场景化应用为主 4.1大模型+装备:增强具身智能水平,有望提升工业设备灵活性和协同性 原理 1.综合分析能力综合视觉、语言、空间、理解、决策能力,从被动感知向主动认知跨越 3.强泛化能力对于陌生场景,无需针对性训练或模型微调,通过多步推理和知识迁移控制机器完成任务2.任务执行能力无需控制代码预设,实现模型对机器人直接控制 能力 实例 4.2大模型+自动化:探索极为初步,距离实际应用还比较遥远 基于大模型实现简单控制代码生成,但当前语言匹配度和生成准确度仍有待提升 ABB:通用大模型工业代码生成能力验证 倍福、西门子:将大模型融入客户端,实现辅助编程 倍福:将大模型融入TwinCATXAE客户端,实现基于对话辅助编程 •生成工业代码逻辑正确率64%,执行成功率39%•能够准确生成计数器、定时器等标准算法,交通控制等控制代码,前馈、压力控制等流程代码•基于多轮对话能够实现代码优化与错误修正 程序开发 •包含控制逻辑、接口需求的复杂Prompt设计•标准化的工业控制函数库构建•大模型接收文档长度与模态限制•生成代码工业场景测试与应用 西门子:联合微软开发工业Copilot工具并将其集成于自身工程框架,通过语言交互实现自动化代码的快速生成、优化和调试 参数调整 基于大模型的控制参数整定已有实验性探索 西门子:利用GPT-4开展非线性多因素PID控制算法整定,并完成某行业具体工况下的模拟验证 调试与集成 4.3大模型+工业软件:从效率精度提升到应用开发模式重构 开发应用模式变革 端到端执行复杂任务 5当前挑战 场景选择难 低时效性 低可信度 大模型如何应用于生产或开展模式创新还不清晰,且无法直接判断ROI 大模型的认知决策取决于历史训练数据,在解决动态工业问题的应用效果较差 应用局限性 大模型准确率80% 工业语料匮乏 私有化成本高 系统集成难 工程化局限性 私有化部署大模型的算力成本+人工较高,多数企业难以承担 工业场景复杂,导致高质量工业语料难以收集,制约大模型性能100张VS10000张+ 业务系统差异性导致工业大模型难以由统一口径集成系统数据 针对具体场景,小模型仅需百张图像即可完成训练,大模型微调可能需万张 展望:AI与大模型加速赋能新型工业化 融合∙协作∙共赢共同把握工业互联网的历史机遇