您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:再谈工业AI:立足跨模型架构AI中台,落地垂类Agent场景 - 发现报告

再谈工业AI:立足跨模型架构AI中台,落地垂类Agent场景

信息技术2025-03-07孟灿国金证券Y***
再谈工业AI:立足跨模型架构AI中台,落地垂类Agent场景

再谈工业AI,当下“易部署、高可靠、低成本”的“既要、又要、还要”或有破局可能。3月6日,Monica.im发布全球首款通用型Agent产品Manus,标志着Agent应用进入全面落地阶段。市场此前一直有声音认为,工业场景具有数据高复杂度、结果低容错率、成本敏感性高等特点,因而在本轮AI大模型技术发展的浪潮中,应用落地节奏相对较慢,短期内较难改变既有的业务流程与生产管理范式。然而,早在20230409《AI+工业信息化,高价值、高普及、高认可之路》报告中,我们已旗帜鲜明地指出,“本次AI技术创新到实际工业场景落地的时间可能快于市场预期”,并详细梳理了工业AI的三类核心应用模式与三大发展阶段。立足当下,我们认为, 1)“多模态大模型any2any”的技术演进趋势有望降低工业场景非结构化数据的处理难度;2)“大模型指挥+小模型执行”的融合工业AI中台有望实现跨模型混合推理与模型与知识库的两端的平滑迭代优化;3)Agents替代人力劳动,叠加DS大幅降低算力成本、国内劳动力工资持续提升的背景下,“机器换人”或逼近拐点时刻。 工业AI中台回应模型侧与数据侧高频“无痛”迭代诉求,商业化正处于渗透率0到1阶段。工业客户行业知识库与外界AI大模型迭代速度较快,一方面,AI决策直接影响工业客户生产质量,因而AI必须基于制造业的专业知识进行定制化(预训练、微调、RAG),并伴随客户的知识库变化同步更新;另一方面,过去两年AI大模型迭代加速,且不同的AI模型适配的应用场景有所差异。工业AI中台能够在不影响正常生产经营的前提下实现AI模型两端的平滑升级和优化,具备“开源大模型+云API”混合推理、多模型综合管理、模型全生命周期管理、可观测性四项核心能力。商业化方面,赛意信息近期中标合同金额达4,867万元的AI中台项目,内容包括基于AI工具链实现数据处理、大模型训练与微调、AI应用开发等端到端能力,并具备接入DeepSeek大模型的能力。 发布于2024年6月的中控技术流程工业时序大模型TPT,结合大量行业知识和工业数据基础,融合工艺参数的设备异常监测及诊断、实现全过程质量精准模拟与优化控制、将难以机理建模的装置运行优化、帮助石化装置实现精准模拟优化和动态路径规划。目前已在万华化学、兴发集团、镇海炼化等数十家大型企业的氯碱、热电、石化等装置实现落地应用。我们认为,工业AI中台目前尚处于渗透率早期,以“华为晟腾+赛意信息”合作模式为例,工业AI中台部署对算力整合、模型管理、工业数据治理、领域Knowhow、工程化交付等能力提出较高要求。 工业AI应用中生产控制环节成熟度持续保持领先,全环节垂类Agent应用点状涌现。在20230409《AI+工业信息化,高价值、高普及、高认可之路》报告中,我们曾基于信通院《工业智能白皮书(2022)》梳理认为,生产控制环节的AI应用占比超57%,拥有表面缺陷检测、生产过程控制优化、质量关联分析、预测性维护、安全管理与巡检、生产作业视觉识别、物料识别与操作等一批典型细分场景。本篇报告中,我们进一步基于2023年605个工信部智能制造优秀场景统计认为,出现频率排名前10的场景生产环节约占7个,生产制造仍是工业AI落地成熟度最高的环节。究其原因:一是场景需求成效显著,产品质量、效率以及设备管理直接与企业经济挂钩,是几乎所有工业企业共同关注的重点环节。二是数据获得性强,生产过程数据、设备运行过程数据等数据量较大、采集相对简单,为AI技术落地提供了基本条件。三是技术成熟度较高,以机器学习、图像识别等传统AI算法面向特定问题实现识别、参数预测及优化为主。垂类Agent场景中:1)赛意信息AI+PCB方案打通MI参数解析BOM成本查询自动生成报价全流程。2)中控技术基于TPT大模型推动流程工业APP订阅制转型,基于DCS+物流机器人实现电解液桶“洗、检、存”“零人工”干预。3)PLM+DS构建知识问答智能体,优选物料智能推荐;打造数字设计工程师,自动生成研发图纸。4)钢铁IT企业发布“钢铁行业大模型”,推出废钢智能检判SaaS化平台。5)基于金蝶云·苍穹开发企业服务智能体,在单据审核、财务分析、人才招聘、征信等多个垂类场景落地Agent。6)EDA企业智能问答+缺陷分类+模型自动分析优化+良率分析。 我们认为,AI大模型问世2年多后再谈工业AI,“易部署、高可靠、低成本”的“不可能三角”或有破局可能,我们看好工业AI中台+垂类Agent应用落地,推荐关注中控技术、赛意信息、中望软件等工业AI重点标的。 工业AI落地节奏不及预期的风险;工业数据隐私保护的风险;传统工业软件企业转型节奏不及预期的风险。 工业场景具有数据高复杂度、结果低容错率、成本敏感性高等特点:一方面,过往已经落地的小模型已在工业识别等少数垂类场景应用较为成熟,满足了低成本+高可靠要求,但较难处理多模态与非结构化数据,泛化能力较弱且较难应用于研发设计与运营管理等场景; 另一方面,大模型对多模态与非结构化数据处理能力较强,但部署成本与运行Token费用较高,假如对结果的可靠性要求较高,则存在成本高企的难题。因而我们认为,工业AI过去面临着“数据高复杂度+结果高可靠+运行低成本”的不可能三角。 因而,市场此前一直有声音认为,在本轮AI大模型技术发展的浪潮中,工业AI应用落地节奏相对较慢,短期内较难改变既有的业务流程与生产管理范式。然而,早在20230409《AI+工业信息化,高价值、高普及、高认可之路》报告中,我们已旗帜鲜明地指出,“本次AI技术创新到实际工业场景落地的时间可能快于市场预期”,并详细梳理了工业AI的三类核心应用模式与三大发展阶段。 立足当下,我们认为,1)“多模态大模型any2any”的技术演进趋势有望降低工业场景非结构化数据的处理难度;2)“大模型指挥+小模型执行”的融合工业AI有望实现研发设计、生产制造、营销运维全链条的“既要又要还要”,且保证生产制造环节模型结果的高可靠性;3)Agents替换而非辅助人力劳动,叠加DS大幅降低算力成本、国内劳动力工资持续提升的背景下,“机器换人”或逼近拐点时刻。 图表1:工业AI-破局“数据高复杂度+结果高可靠+运行低成本”的不可能三角 1.1工业数据可处理了吗?—多模态大模型any2any直击非结构化数据处理难题 工业领域涵盖广泛,包括41个工业大类、207个工业中类、666个工业小类,导致数据结构多样,数据质量参差不齐。同时,由于工业生产过程中的各个环节相互交织,数据之间的关联性和复杂性也较高。数据的来源、采集方式、时间戳等都会影响数据的准确性和完整性。这种数据结构的多样与质量的参差不齐给工业大模型的训练和应用带来了挑战。 以往的工业AI构建,需要投入大量的时间和资源进行数据清洗、预处理和校验,以确保数据的准确性和一致性。 AI多模态大模型擅长处理非结构化数据,any2any模型理解/生成能力有望降低工业数据的清洗工作。同时,增强的RAG技术能够与工业非结构化数据建立对话,理解大段文字的检索意图,且通过外挂知识库提升结果生成的可靠性,降低幻觉出现的概率。 图表2:多模态大模型“any2any”趋势显现,增强RAG解决非结构化数据处理难题 目前,工业大模型主要分为三种构建模式:一是可以基于大量工业数据和通用数据打造预训练工业大模型,支持各类应用的开发;二是可以在基础大模型上通过工业数据进行微调(微调是指已经预训练好的模型基础上,使用特定的数据集进行进一步的训练,以使模型适应特定任务或领域),适配特定工业任务;三是可以在不改变模型参数的情况下,通过检索增强生成(RAG)为大模型提供额外的数据,支持工业知识的获取和生成。 图表3:工业大模型分为预训练、微调、检索增强生成三种构建模式 预训练工业大模型:硅谷创业公司SymphonyAI推出基于无监督预训练的工业大语言模型,该模型的训练数据包含3万亿个数据点,12亿token,能够支持机器状况诊断,并回答故障状况、测试程序、维护程序、制造工艺和工业标准相关的问题。 图表4:SymphonyAI推出基于无监督预训练的工业大语言模型 微调:Cohere推出全面的微调套件,其中包括生成微调、聊天微调、重新排序微调和多标签分类微调等解决方案,可以满足企业在微调各种AI应用时的需求。基于微调,企业可以定制模型,在文本生成、摘要、聊天、分类和企业搜索等目标用例上获得更好的性能。 图表5:Cohere微调套件 检索增强生成:Cognite利用检索增强生成技术,将大模型与其工业DataOps平台CogniteDataFusion结合起来,为工业客户提供基于数据的洞察和解决方案。通过将不同来源和类型的工业数据进行向量化,并存储在一个专门的向量数据库中,可以作为RAG的检索源,与用户的自然语言提示一起输入到大模型中,使模型能够提供更加精准的建议或解决方案。 图表6:Cognite利用RAG检索不同来源和类型的工业数据 1.2如何保障结果高可靠?—大模型指挥+小模型执行,三类核心应用模式成熟度较高 小模型适配生产制造环节:小模型在诸如生产线监控、设备维护、质量检测、视觉识别、缺陷检测等任务中落地成熟度较高,显著提升了生产效率和产品质量控制水平。 但在研发设计以及以智能问答为主的运营管理环节,小模型的效果一般,成熟度也相对较低。这主要是因为小模型通常专注于解决特定任务,对于需要更广泛知识和上下文理解的复杂任务(如产品设计、市场预测等),其表现并不理想。具体来说,在研发设计中,小模型难以处理涉及多学科交叉的问题;而在运营管理环节,小模型无法提供足够的智能支持来进行复杂的决策制定。 大模型适配研发设计+运维管理环节:大模型在处理复杂任务时展现出了显著优势,尤其是在需要综合分析多种因素做出决策的情况下,大模型能够有效地辅助人类专家进行判断。然而,大模型在生产、制造等低附加值场景的落地却存在明显局限性。 一方面,由于大模型的训练和运行需要大量的计算资源,这导致了在实际应用中的高成本问题;另一方面,大模型在实时性和可信度方面也面临挑战,尤其是在需要快速响应和高度可靠性的工业生产环境中。大模型的延迟问题和不确定性使得它们在某些情况下不如小模型那样适合用于即时反馈和控制。此外,由于工业环境中的许多任务要求极高精度,大模型的预测误差可能会导致严重后果。 我们认为,工业AI可以采取“大模型指挥、小模型执行”的协作方式,即在需要全局优化和预测性分析的场景中,利用大模型进行宏观指导与决策支持;而在具体执行与实时反馈方面,则依靠小模型发挥其高精度和低成本的优势。例如,华为在5G设备制造中将大模型用于供应链预测与管理,而小模型用于具体的生产流程监控,实现了模型间的协同优化。 图表7:工业AI协作方式:大模型指挥,小模型执行 在20230409《AI+工业信息化,高价值、高普及、高认可之路》报告中,我们曾详细梳理过工业AI的三类核心应用模式: 识别类应用:与通用算法技术中的机器视觉等相对应,包括工业视觉检测、表单识别和工业语音信号识别等。 数据建模优化类应用:与通用算法技术中的数据科学相对应,如基于机器学习、深度学习技术的智能排产、设备运维、工艺参数优化等。 知识推理决策类应用:与通用算法技术中的知识工程相对应,如冶炼专家系统、设备故障诊断专家系统、供应链知识图谱等。 图表8:工业AI主要包括识别类、数据建模优化类、知识推理决策类三大核心应用模式 1.3“机器换人”成本拐点到了吗?—算力降费+人力成本提升,Agent换人逻辑更顺 过去一段时间,工业AI落地在我国面临“机器换人”不划算的问题,原因是我国制造业工资相对较低,工业AI早期从部署成本到运行过程中的AI Token费用高昂,由于工业场景对成本较为敏感,因此阶段性存在“人比机器便宜”的落地阻碍。 我们认为,一方面,百万Token输入价格在过去2年实现两个数量级以上的降费,同时在保证模型精度的前提下,通过剪枝、量化、蒸馏等方式可以有效地减少模型的参数量、计算复杂度和存储需求