您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[工业互联网产业联盟]:工业大数据创新竞赛白皮书(2020) - 发现报告
当前位置:首页/行业研究/报告详情/

工业大数据创新竞赛白皮书(2020)

工业大数据创新竞赛白皮书(2020)

编写说明我国工业互联网正在从概念普及进入实践深耕的发展阶段,在这一进程中,大数据作为一种新的资产、资源和生产要素,技术创新和应用实践日趋活跃,正成为驱动制造业智能化变革的重要动力。为充分激发数据要素价值,贯彻落实《国务院关于深化“互联网+先进制造业”发展工业互联网的指导意见》,中国信息通信研究院自 2017 年起在工业和信息化部指导下,已连续举办了三届工业大数据创新竞赛,这也是首个由政府主管部门指导的工业大数据领域的权威全国性创新竞赛。竞赛在组织方式上充分借鉴了发达国家推动工业大数据创新应用的先进模式,开发出诸多聚焦行业细分领域的算法模型,吸引了海内外近 6800 人参赛,同时品牌逐渐走向国际,第三届竞赛与全球工业大数据领域顶尖活动PHM(故障预测与健康管理)亚太学术论坛合作,仅线上答辩直播吸引超过 5 万人观看,为工业大数据领域的相关研究人员和创业者们提供了成果转移转化的交流平台,在产业界逐渐形成品牌影响力。第一届竞赛后,结合获胜选手分析模型和方法发布《工业大数据竞赛白皮书(风机结冰故障分析指南)》引起社会广泛关注。时隔两年,为进一步总结优秀第二届、第三届工业大数据创新竞赛算法,中国信息通信研究院组织参赛者编写了《工业大数据创新竞赛(2018-2019)白皮书》,希望将两届竞赛的经验与技术成果固化并加以推广,与业界共同推动工业大数据发展。 《工业大数据创新竞赛(2018-2019)白皮书》收录了机床加工刀具寿命预测赛题的 5种获奖解法以及转子部件脱落故障预测赛题的 7 种获奖解法,为学术研究和产业实践提供参考。白皮书的编写过程得到大赛组委会和参赛选手的大力支持,相关参赛人员根据自己对竞赛题目的解法,给出了详细、清晰的方法流程与结果讨论。我国工业大数据竞赛的发展仍处于起步阶段,大赛组委会愿真诚吸取各界的反馈意见,持续提升大赛水平,并将大赛成果以白皮书等形式定期与社会各界分享。 编写单位:中国信息通信研究院 工业大数据创新竞赛组委会 工业互联网产业联盟 指导专家:王建民 余晓晖 李 杰 侍乐媛 李清源 赵 敏 韩 庆 郭 翘 王友升 邢 镔 郭朝晖 刘 杰 吴振宇 李城梁 徐长恺 郭 翘 晋文静 胥 佳 崔必如 郑弘孟 孙可意 周映彤 谢彦守 江侊紘 林焱辉 黄亦翔 孟繁亮 赵志海 金 超 田春华 傅若玮 韩 庆编写组成员(排名不分先后): 李 铮 杨艳冉 刘 迎 孙 昕 赵 男 吴文龙 周训淼 邓惠民 王晓明 金 超 胡江雪 王旻轩 鲍亭文 王晓明 杨立宁 刘思辰 刘 锋 万 伊 程 骋 沈国锐 马贵君 蔡 鑫 曾 雄 刘重党 姚 荣 牛家禾 胡 翔 戴 俊 宋 哲 申颖君 钮鹏飞 刘正锋 景宏杰 潘彤阳 蔺思宇 刘 涛 李素洁 杨晨旺 崔晓龙 季天泽 Myungyon Kim Jongmin Park Yongjin Shin 序中国工业大数据创新竞赛自创办以来,就被寄予了厚望,很欣喜地看到它正在蓬勃发展。它作为产业界与学术界的重要桥梁之一,对工业大数据这一跨学科领域创新人才的培养起到了重要的作用。在近几年中,我有幸参与大赛的筹划和评审工作,代表 IMS 中心和富士康工业互联网为大赛提供帮助。大赛获得的关注程度以及选手们的出色表现都令人感到惊喜。如今,信通院将第二届和第三届大赛中的优秀成果集结成为《工业大数据创新竞赛白皮书 2018-2019》,相信能够为从事工业大数据应用研究的企业和学者们提供有价值的参考。在工业互联网的发展过程中,人工智能技术与工业结合的探索得到了进一步推进,工业人工智能的理念兴起。我对它的关键要素做出了一个总结,可以归纳为“ABCDEF”六大技术要素,来阐释工业人工智能是由多个技术元素整合而成的一个系统工程。这六个字母分别代表 Analytics(建模分析)、Big Data(大数据)、Cloud(云计算)、Domain Knowledge(领域知识)、Evidence(事实依据)、Feedback(反馈闭环)。前三个技术要素同时也是 AI 技术的三个要素(数据、计算能力和算法),但是与工业人工智能有所区别。在分析建模方面,前者以算法为核心,后者以场景和问题为核心;在数据技术方面,前者围绕解决“4V”挑战,后者则是管理“3B”特性;在计算平台方面,前者以云计算和集中式的运算能力为主,后者以“端”到“云”的融合架构为主。后三个要素则是带有鲜明的工业特质的技术要素,也是人工智能与工业系统相融合的接口。在这两次的工业大数据竞赛评审中,我非常欣慰地看到多支优胜队伍,在解决相关问题时,并没有局限于基础机器学习方法的套用,而是非常深入地学习了相关的领域知识。还有的获胜队伍结合数据驱动的方法弥补对机理了解的不足。这些研究工业数据问题的方法和精神,我非常赞赏。中国未来要实现智能制造需要什么样的人才?在这两届大赛中我也有了更深的体会。我认为,若要真正实现智能制造,中国仍需要一批工业大数据的年轻生力军,不仅拥有扎实的算法基础和学习能力,还能够下到工厂,进入制造知识的内核。用算法的能力补偿有经验的专家,相互碰撞与融合,只有这样才能推动智能制造高质量发展。工业的未来属于年轻人。我非常欣慰地看到,信通院举办的工业大数据竞赛每年都有数千位参赛选手参与竞赛,更有 90% 以上是学生。愿各位工业大数据领域的开发者、实践者,可以一直保持对数据的好奇心,愿意冒险,愿意吃苦,发掘数据中的根本原因,为生产带去更大效益。衷心祝愿中国工业大数据创新竞赛越办越好,成为全球产学界共同推崇的传统和品牌,为中国智能制造产业生态源源不断地输送优秀人才。Jay Lee (李杰),2020 年 8 月 编写说明 1序 3目 录 4第一篇章 第二届工业大数据创新竞赛 7一、第二届竞赛赛题介绍 7二、第二届竞赛英雄榜 10三、第二届竞赛优秀解法集——刀具剩余寿命预测题目 11(一)基于经验模态分解的非参数模式匹配刀具寿命预测方法 11(二)基于多传感器融合的刀具寿命预测方法 31(三)基于前馈神经网络的刀具剩余寿命预测 42(四)基于 DTW 退化特征和 CNN+SVR 网络的刀具剩余寿命预测 53(五)基于 DWT-LSTM 网络的刀具剩余使用寿命预测 59目 录 第二篇章 第三届工业大数据创新竞赛 66一、第三届竞赛赛题介绍 66二、第三届竞赛英雄榜 69三、第三届大赛优秀解法集—— 转子部件脱落故障预测 70(一)基于 LightGBM 分类算法的转子部件脱落故障识别方法 70(二)基于生成对抗网络的转子故障脱落研究方法 79(三)基于多模型投票与梯级分类算法的转子部件脱落故障预测 89(四)基于全息故障特征提取的转子部件脱落智能识别方法 99(五)基于多模型融合的转子部件脱落故障识别方法 108(六)基于变分模态分解与时间 - 全谱分析的旋转机械转子部件脱落故障预测 115(七)基于多传感器信号变化分析的转子系统异常检测 137第三篇章 工业大数据产业创新生态及平台 148一、工业大数据产业创新生态 148二、工业大数据产业创新平台 149CONTENTS / 目录 6习近平总书记在中共中央政治局第二次集体学习时强调,要深入实施工业互联网创新发展战略,系统推进工业互联网基础设施和数据资源管理体系建设,发挥数据的基础资源作用和创新引擎作用,加快形成以创新为主要引领和支撑的数字经济。中国是制造大国,也是数据资源大国和应用大国,预计到 2020 年,我国数据总量全球占比将达 20%,将成为数据量最大、数据类型最丰富的国家之一。工业大数据正成为引领工业互联网创新发展的基础战略资源和新型生产要素。在工业和信息化部指导下,中国信息通信研究院(简称“信通院”)举办了第二届和第三届工业大数据竞赛。大赛以“赋能与赋智,构建工业大数据应用生态”为主题,以“开放共享、协作共赢”为原则,是首个由政府主管部门指导的工业大数据领域的权威的全国性创新竞赛。竞赛在组织方式上充分借鉴了发达国家推动工业大数据创新应用的先进模式,基于制造企业真实数据资源和需求场景,面向全社会征集优秀解决方案,在发掘专业技术人才的同时,助力与解决制造企业实际问题。第二届和第三届大赛分别于 2018 年 11 月和 2019 年 5 月启动,累计吸引了来自海内外近 5000 名参赛选手,其中 80% 以上来自于高校学生,涉及计算机、自动化控制、机械工程、统计、动力工程等多个领域。第二届竞赛设置两道赛题,分别为富士康的机床加工刀具寿命预测,和积微物联(四川攀枝花钢铁旗下企业)的钢卷吞吐量预测。第三届竞赛与全球工业大数据领域顶尖活动 PHM(故障预测与健康管理)亚太学术论坛合作,设置了转子部件脱落故障预测一道赛题,仅线上答辩直播吸引超过 5 万人观看,为工业大数据领域的相关研究人员和创业者们提供了成果转移转化的交流平台,在产业界逐渐形成品牌影响力。此外竞赛还获得了来自于华为、北京工业大数据创新中心、昆仑数据、天泽智云、蒂森克虏伯、ABB、PTC、美国国家仪器(NI)等国内外企业、研究机构的支持。在第二届和第三届大赛中,由信通院组织建设的“工业大数据产业创新平台”承担了相关赛务的组织和管理工作,提供了数据下载、竞赛结果评分、参赛交流、算法培训、算法工具等多种支持。 7第一ᓤ章 第二届工业大数据创新竞赛第一篇章 第二届工业大数据创新竞赛一、第二届竞赛赛题介绍第二届大赛共有两道赛题,所属不同行业和建模领域的问题,具有很强的代表性。赛题一:钢卷仓储吞吐量趋势预测赛题问题来自成都积微物联集团股份达海产业园。该产业园是以钢材仓储、金属加工、配送、物流金融、电子商务及总部基地多功能为一体的综合产业园。为提升园区运作效率,提前规划库位分配和装备准备,需要对未来 4 周的吞吐量进行合理的预测。赛题要求选手通过对达海产业园历年的历史销售、订单、仓储、吞吐量等数据(经过脱敏处理)分析建模,并结合国家未来发展趋势、钢铁供需市场等外在因素,实现对未来一个月内,达海产业园各品类的钢铁吞吐量的预测分析。预测任务主要有两个:1. 按照两大类货品类型(冷卷、热卷),分别预测未来 4 个周钢铁的周入库量和周出库量(重量);2. 按照两大类货品类型(冷卷、热卷),分别预测未来 7 天的日入库量和日出库量(重量)。赛题为选手提供了两大类数据,包括:仓储数据:库存数据表、入库数据表、出库数据表,数据包括业务单据号、货主、对应产品、重量、数量、单据创建时间、单据完成时间、业务单据状态等信息。基础数据:字段数据表,解释各个表字段的含义;储户费用表,主要提供储户费用相关的数据。赛题同时鼓励参赛选手从政府官方网站、互联网等渠道获取获取外部公开数据使用,包括钢铁市场数据、大宗物资运输数据、经济发展政策、贸易新闻等。赛题通过以下方式进行评分。比赛中会开放六次测试集,第一次开放的测试集为初赛阶段的测试集,该阶段的分数不计入最终的成绩排名。决赛阶段开放五次测试集,最终的成绩排名由该决赛阶段五次测试集的得分的平均值决定。针对每次测试集的评分方案如下: 8周吞吐量的预测和天吞吐量的预测均采用 SMAPE 作为评分准则,具体计算公式如下: 其中:Ak 是实际值,Pk 是预测值,k 是预测结果序列的索引,k=1,2,3,....,44,T是预测结果序列的长度,T=44。M 为常数, M=800。最后排行榜的得分计算方式如下: 赛题二:机加工刀

你可能感兴趣

hot

工业大数据创新竞赛白皮书

工业互联网产业联盟2017-08-25
hot

工业大数据创新竞赛白皮书(2017年)

信息技术
工业互联网产业联盟2018-02-03
hot

工业大数据技术架构白皮书

中国信通院2018-04-15
hot

工业大数据技术与应用白皮书(2017年)

信息技术
工业互联网产业联盟2017-07-04