AI智能总结
人工智能:首个多模态千亿级大模型,有望赋能百业。1)华为具备全栈全 场景AI解决方案,为大模型提供坚实的软硬件平台,包括Ascend(昇腾)、CANN、MindSpore、应用使能四个层次。其中,MindSpore支持了盘古NLP大模型、盘古CV大模型、科学计算大模型、多模态大模型等的开发训练:盘古NLP大模型是业界首个千亿参数的中文预训练大模型;盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力、在ImageNet上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。2)华为盘古大模型加速行业应用的孵化与创新,边缘端引入行业应用伙伴,例如润和软件、常山北明、软通动力、云鼎科技、中科星图等,搭载openHarmony+AI大模型应用的国产化设备加速落地。 管理输出:打造Meta-X生态,重新定义企业数字化转型。1)随着ERP角色发生变化,企业前端业务系统逐渐独立,形成CRM、SRM等周边系统,围绕ERP建立生态体系成为重要趋势。2)在高端ERP市场,国外SAP和Oracle占比达到53%,随着Oracle退出中国,国产ERP机遇浮现。3)华为打造Meta-X产品族,引入产品及实施伙伴,例如赛意信息、汉得信息、法本信息、能科科技、鼎捷软件,或将构建企业数字化良好生态。 信创软件:欧拉OS+高斯DB,生态合作共促繁荣。1)OpenEuler跨越生态拐点,根据2022年11月世界互联网大会披露,openEular累计装机量达245万套,全球伙伴400+,全球开发者1.1万+。其中麒麟软件(中国软件子公司)贡献度排在首位,统信软件(诚迈科技子公司)、拓林思(创意信息子公司)紧跟其后。2)截至2022年底,openGauss已经在10+行业核心系统累计部署3万+套。截至2023年3月19日,贡献度最高的会员单位,除了华为和个人贡献者外,海量数据贡献度遥遥领先。 推荐标的: 华为AI: 1)大模型端侧应用落地(结合鸿蒙OS):润和软件、常山北明、软通动力、云鼎科技、中科星图。 2)昇腾硬件伙伴:神州数码、拓维信息、广电运通、四川长虹。 华为Meta-X: 1)MetaERP伙伴,赛意信息、汉得信息、法本信息。 2)MetaPDM伙伴,能科科技、鼎捷软件。 华为信创: 1)高斯DB伙伴:海量数据。 2)欧拉OS伙伴:中国软件、诚迈科技、创意信息。 风险提示:AI技术迭代不及预期风险;财政支出不及预期;行业竞争加剧风险;贸易摩擦加剧。 一、人工智能:首个多模态千亿级大模型,有望赋能百业 小模型到大模型成为重要发展趋势,大模型对软硬平台提出更高要求。1)大模型能够解决AI模型定制化和应用开发碎片化,可以吸收海量的知识,提高模型的泛化能力,减少对领域数据标注的依赖。2)大模型有利于激活深度神经网络对大规模无标注数据的自监督学习能力,同时对于AI框架的深度优化和并行能力都有很高的要求,是深度学习框架下将AI做到极致的集大成者。 华为全栈全场景AI软硬件平台,包括Ascend(昇腾)、CANN、MindSpore、应用使能四个层次: Ascend(昇腾):即IP和芯片组层,提供基于统一、可扩展架构的系列化AI IP和芯片,包括Max、Mini、Lite、Tiny和Nano五个系列。 CANN(神经网络计算架构):提供芯片算子库和算子开发工具,关键组件是高度自动化算子开发工具Tensor Engine,通过统一的DSL接口(TE Interface),配合预置的高层模板封装、自动性能调优等工具集合,让用户方便地在Ascend芯片上开发自定义算子(CCE lib-extension)。 MindSpore(AI框架):为支持端、边、云独立的和协同的统一训练和推理框架,包括模型库、图计算和调优工具包等核心子系统,具备ML/DL/RL的统一分布式架构,灵活的程序界面,并支持多种语言。 应用使能层:是一个机器学习PaaS,提供全流程服务、分层分级API以及预集成方案。ModelArts是面向开发者的一站式AI平台,为机器学习与深度学习提供海量数据预处理及交互式智能标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。 图表1:华为全栈全场景AI解决方案 MindSpore支持了盘古NLP大模型、盘古CV大模型、盘古科学计算大模型、多模态大模型等多种模型的开发训练。通过模型泛化,解决传统AI作坊式开发模式下无法解决的AI规模化、产业化难题。 图表2:华为云盘古大模型 1)NLP大模型:盘古NLP大模型是业界首个千亿参数的中文预训练大模型,在训练过程中使用了40TB的文本数据,包含了大量的通用知识与行业经验。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。 图表3:各NLP大模型参数统计 2)CV大模型:盘古CV大模型首次实现模型按需抽取、业界最大CV大模型(30亿参数,10亿级图像)、首次实现兼顾判别与生成能力、在ImageNet上小样本学习能力上的业界第一。 首次兼顾图像判别与生成能力,捕捉样本决定性信息。1)图像中精准识别层次化的信息非常重要,例如“如何区分白色猫和白色狗的图片”,白色不是最重要的信息,动物才是图片中起决定性的信息。把握好图片中层次化的信息,能够快速的定位到图片中哪部分信息是起决定作用的,让算法以自适应的方式去关注比较重要的地方或内容,这样就容易捕捉样本之间的关系。2)盘古CV首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求,同时能够融合行业知识的微调,快速适配各种下游任务。 提升学习效率,在ImageNet上小样本学习能力上的业界第一。为了解决模型大,数据多带来的学习效率低,表征性能弱的问题,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化。目前盘古CV大模型在Image Net 1%、10%数据集上的小样本分类精度上均达到目前业界最高水平。 图表4:盘古CV大模型 3)盘古科学计算大模型:盘古气象大模型提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20%以上的位置误差。 图表5:盘古气象大模型 4)多模态大模型:紫东.太初是中科院自动化所与MindSpore社区联合打造的全球首个图、文、音三模态大模型,于2021年9月发布。紫东太初大模型首次实现语音生成视频功能,开拓性地实现了图-文-音语义统一表达,同时兼具跨模态理解和生成能力。 图表6:华为携手科研院所推出全球首个图文音三模态千亿大模型 紫东.太初将文本+视觉+语音各个模型高效协同,实现超强性能,在图文跨模态理解与生成性能上都能领先目前业界的SOTA模型,高效完成跨模态检测、视觉问答、语义描述等下游任务。模型的视频理解与描述性能在2021年ACM Multimedia(国际多媒体大会)和ICCV(国际计算机视觉大会)两项人工智能领域国际顶会的视频语义理解与视频描述中均展现出当前最高水准。 图表7:紫东太初的视频理解与描述性能获得顶会冠军 华为盘古大模型为人工智能的行业实践提供牵引,加速行业应用的孵化与创新:华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成了“基础大模型-行业大模型-细分场景大模型”的发展路径,并且在能源、金融、医疗、煤矿、农业、气象等领域中实现降本增效。 国家电网无人机电力巡检:基于盘古CV大模型的智能缺陷识别,视觉预训练大模型助力下游缺陷识别,进一步提升巡检效果,缺陷样本标注代价减少85%,平均精度提升18%。 浦发银行浦慧云仓:盘古CV大模型1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。9种场景差异较大,大模型具备较强泛化能力(例如一个模型同时做行为异常,轨迹异常检测)。异常样本种类多、数量少,大模型可利用小样本数据取得高精准度结果。(异常行为数据大多数呈中长尾分布)利用大模型的时空对齐能力,综合多摄像头数据,解决局部遮挡等问题,准确估计物体轨迹。 广发证券企业财务智能预警:2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。 药物研发:华为云盘古药物分子大模型学习了17亿个小分子的化学结构,在无监督学习模式和业界独有的“图-序列不对称条件自编码器”深度学习网络架构下,更好地对分子结构与性质进行预测与推荐。在盘古药物分子大模型优先推荐的小分子化合物基础上,科研人员进一步进行人工实验验证。实验结果表明,盘古药物分子大模型的成药性预测准确率比传统方式高20%,进而提升研发效率,让先导药的研发周期从数年缩短至一个月,同时降低70%的研发成本。 边缘端引入行业应用伙伴,搭载openHarmony+算法的国产化设备加速落地: 润和软件:润和软件基于昇腾AI基础软硬件平台,打造危化品存储室智能安全管控解决方案,帮助危化品存储操作实现智慧安全分析。 常山北明:2022年北明软件正式加入昇腾万里伙伴计划,成为昇腾应用软件伙伴,共同推进人工智能产业繁荣发展,明确在金融、互联网、电力等领域的全方位合作意向。 软通动力:软通动力深耕数字创新服务+AI赛道,打造了完整的技术创新体系及创新的AI技术能力和团队,并成立了专注于AI领域的人工智能研究与创新中心(AIC),基于昇腾AI推出的AI端云一体化产品(全信创软硬一体化)也已发布。 图表8:AI框架MindSpore应用合作伙伴 中科星图:中国绘制国土、林业等行业遥感调查与更新仍主要采用人工目视解译,存在费事、费力、成本高、周期长的问题,不能满足当前经济社会发展对自然资源信息快速获取的需求。同时,遥感图像不仅仅是CV图像处理问题,更是地学知识分析的问题。通过华为AICC为核心主体,从数据供应方提取数据,由高校西安电子科技大学提供算法和模型,通过中科星图来提供服务,汇聚算力、数据、模型核心价值,形成“华为+高校+中科星图”的合作方式。 图表9:遥感调查传统方式 图表10:华为在遥感数字经济合作方式 图表11:雷达遥感预训练大模型 云鼎科技:1)云鼎科技联合华为公司煤矿军团、华为云、2012实验室,就AI在煤矿领域的应用展开合作,依托华为在AI算法方面的技术优势,结合云鼎科技在能源生产领域的业务实践,共同研究AI算法模型在能源生产领域的应用。2)2022年10月17日,云鼎科技与华为签署框架合作协议,双方围绕能源行业产业数字化和数字产业化发展方向,充分整合和发挥各自业务和技术创新优势资源,形成紧密协作的数字化创新模式,加快推动物联网、大数据、人工智能、区块链、5G等新一代信息技术在全要素、全产业链、全价值链中的深度融合应用。 图表12:云鼎科技与华为签署框架合作协议合作方向 图表13:云鼎科技AI服务平台 昇腾硬件合作伙伴: 神州数码:子公司神州鲲泰,依托自主创新和生态体系,为客户提供端到端的信创全产业链解决方案。 拓维信息:子公司湘江鲲鹏依托自主创新的研发基地、先进智能的制造基地和开放共享的应用实验室,在智慧城市、政务云、教育、互联网、人工智能、通信、金融等重点行业进行全面应用,联合华为在湖南打造首个“硬件+软件”的鲲鹏生态基地,为各行各业