AI智能总结
作坊式的AI开发无法满足行业高效高质量数字化转型需求 AI走进企业核心生产系统,开始创造更大价值 “2025年,企业对AI的采用率86%(当前4%)”EI AI实践:600+项目,30%进入生产系统,但是 AI进入千行百业面临诸多挑战 1开发门槛高,需要专业人员持续支持 华为云EI的AI类产品设计理念: 2场景碎片化,作坊式开发难以规模复制 •EI提供基于行业的场景化解决方案,同时配套简化AI应用开发、落地的资产或工具。•提供平台+生态类产品1.开放-引入大量生态伙伴2.AI Gallery–开放订阅,吸引伙伴合作关键资产(大模型)+工具(流水线)+简化AIAPP 3行业知识与AI技术结合困难,性能不达标 4行业对普通AI模型攻击、隐私、安全担忧 华为盘古大模型推动人工智能开发从“作坊式”到“工厂式”升级 工厂式开发 优秀的泛化能力 充分挖掘数据内在联系,达到更高的泛化性能,对不同场景鲁棒性更强 高效样本筛选能力海量无标注样本筛选,节省80%以上人力标注代价 预训练大模型:百亿参数,十亿数据 微调部署:更高,更强,更便捷 小样本/零样本能力 自动化数据增强,数据挖掘算法,实现零训练样本下缺陷样本识别,较传统方法发现率提升2~3倍 •更高精度:20+电力视觉检测任务,相比传统小模型平均精度提升5%~10%•更强泛化能力:适用80%以上分类、检测、分割、异常检测等AI任务•更便捷微调策略:少量1%-5%参数微调,达到算法专家水准 低门槛AI开发 提供自动化工作流,自动数据处理,自动化调参,自动化生成模型,减少对AI开发工程师专业依赖 分类,业界领先81% 盘古CV工具链 盘古大模型 工具链核心目标•落地:提供将盘古预训练模型落地到定制化场景的能力 •资产管理:对盘古团队各种模型(结构、行业)进行资产管理,并根据用户需求自动选型 •积累:利用用户的使用记录,优化选型策略和调优策略 主要涉及的技术点和功能•超网训练+模型抽取:大模型抽取满足用户需求小模型的能力 •将需求,数据,难题和经验结构化表示•大模型配备知识库,业务更新知识库•模型蒸馏:大模型蒸馏超网训练•自动学习:盘古团队为每款模型积累了大量调优策略•知识积累:调优策略池根据用户使用,不断优化Ranking 盘古大模型三大独特优势 独有先进的分层架构自身工业知识沉淀优势,商用进展最快 学术大模型—根技术做深学术领先梯队 降低资源消耗 •采用压缩学习+数据蒸馏来提速训练过程,降低训练成本50%以上 消除边际效应 L1十亿级行业大模型 •在大模型规模保持领先的同时,保证性能随模型规模线性增长。 创新架构 •基于CNN和Transformer联合架构,兼具局部特征和全局注意力的优势 逻辑推理能力 •构建大规模推理数据,探索显式推理与隐式推理的不同技术路线,引入知识图谱。 盘古大模型的基石 •国家级领军人物•3+华为天才少年•20+博士•30+工程师•50+高校实习生 实现工业化AI开发新模式 降低了AI使用门槛,践行普惠AI 盘古视觉大模型:铁路XXX故障识别 挑战:•部分图片拍摄质量差 •故障类型多:上百种故障•样本分布不均衡:部分故障类型稀缺(<10)•未知故障预测,要求高召回 平均召回率25%异常检测漏报80% 现场实测情况:郑州北车辆段5T检测车间集中作业分析的14条线路, 在2021年9月19日至2021年10月20日期间,由5T检测车间动态检车员预报并经组长确认为提报故障的数据样本(故障图片)共计32007张。 盘古视觉大模型:XXX电力巡检 盘古视觉大模型:XXX制造部场景 基于盘古工作流的端到端自动化解决方案 自动化抽取任意耗时需求模型<自动化生成算法解决方案 盘古预训练超网 模型工作流+算法工作流 低成本+高效+可靠< 部件输出•满足超高的召回、精度要求 •满足模型耗时、大小要求 样本输入•全新类别•极少量样本 盘古大模型:煤矿场景 AI专家:不同场景基于需求对基础AI能力进行算法选择、模型参数调优等,开发出场景化的AI工作流(支持柔性制造的流水线) 盘古大模型:基于行业数据的预训练,实现异常样本识别率大幅提升 基于行业数据预训练的行业大模型(L1) •减少99.62%的负样本标注工作量•减少的负样本标注工作量=过滤掉的正常样本数/样本总量:(1080000-4109)/1080000=99.62% •行业数据预训练作为底座,提供兼顾行业knowledge的基础网络模型•异常检测、异常建模、目标检测、行业know-how方案、多模态融合等根据场景进行多方案冗余设计,提供性能最佳的综合解决方案•目标检测:采用3亿量级盘古目标检测模型,进一步提升样本筛选效率 注:负样本标注工作量=负样本数量*单个负样本标注工作量 盘古大模型:良好的泛化性及高效性,提升算法通用性,实现AI快速应用 通用性强:相似场景下,少量数据即可达到更高的准确率 新场景高效适配:大模型的算法准确率提升15%左右 •在某矿上训练得到的皮带模型加入少量山东能源数据进行微调训练,相比业界小模型性能显著提升 •堆煤场景中,分别使用26,78,104,130个训练样本验证。大模型全方位超过业界小模型,准确率普遍提升15%左右 依托AITISA产业联盟,联合4伙伴成立大模型产业推进组 2023:大模型产业推进组大模型行业场景借助联盟推进场景复制金融(智能投研)工业质检、农业气象、金融 2022:大模型产业推进组大模型技术沙龙提升产业影响力大模型白皮书创新研究专题沙龙高校老师罗马广场 2021:大模型产业推进组华为、鹏城实验室、中国科技大 学、上海交通大学、厦门大学2021全球智博会产品金奖首期大模型专题技术沙龙盘古大模型产业发展联合专项工作组专题会议研讨 大模型 总结:盘古大模型解决传统AI开发的难题 低门槛AI开发 精准度高 解决碎片化问题 泛化性能高 高效样本标注 盘古提供自动化工作流,自动生成模型,减少对AI开发工程师专业依赖。同时可以根据更新数据快速进行模型迭代,做到“边用边学”。 大规模参数的模型可以更深层挖掘数据背后的逻辑,达到更高的泛化性能,对不同场景的鲁棒性更强。 在大多数工业场景,从海量数据搜集缺陷样本耗时耗力。盘古能够实现缺陷样本高效筛选,节省80%以上人力标注代价。 经过海量数据预训练,使得大模型拥有了强大的拟合能力,相比小模型,大模型的拟合能力带来了精度优势。 谢谢!