AI智能总结
SECURITIES 如何看待华为盘古大模型5.0? ——科技龙头巡礼专题(一) 分析师刘航执业证书编号:S1480522060001分析师刘蒙执业证书编号:S1480522090001分析师张永嘉执业证书编号:S1480523070001分析师石伟晶执业证书编号:S1480518080001研究助理李科融执业证书编号:S1480124050020 摘要 语言学习平台Q1:华为盘古大模型为何能在AI领域中异军突起?得益于四大关键因素:(1)技术创新显著,包括针对复杂3D气象数据的三维神经网络与层次化时域策略,以及在全系列、多模态、强思维方面的全面升级,提升了模型的理解与规划能力。(2)基于华为自研达芬奇架构,盘古大模型拥有强大计算能力,能高效处理大规模数据,并广泛应用于智能问答、医疗、金融等多个领域。(3)华为云全面建设盘古大模型全域协同生态,与多家企业签约合作,共同推动行业落地和应用。(4)华为持续加大AI研发投入,华为云构建了包括AI原生的云基础设施、数据湖和数据治理:、算法框架以及AI开发平台和大模型的全栈工业AI能力,推动盘古大模型升级优化。 Q2:盘古大模型推出的背景和发展如何?华为出于对在人工智能兴起、数字化转型加速、市场需求多元化,结合自身的战略部署,以及竞争格局多元化的挑战的背景下,推出了盘古大模型。2024年6月21日,在华为开发者大会2024(HDC 2024)上,由华为常务董事、华为云CEO张平安亲自揭幕,正式发布了盘古大模型5.0版本。 Q3:盘古大模型5.0有什么优势?与原先的盘古大模型4.0相比,华为盘古大模型5.0的优势可以从全系列、多模态和强思维三方面展开:(1)全系列升级:5.0版本推出了适配不同业务场景的多种规格模型,包括十亿级到万亿级参数的系列,分别适用于手机、PC端侧智能应用、低时延推理场景、复杂任务处理及跨领域多任务处理,满足多样化的业务需求。(2)多模态升级:5.0版本不仅支持文本、图片、视频等常见模态,还新增了对雷达、红外、遥感等模态的支持,且在多模态理解和生成能力上均有显著提升,尤其在自动驾驶、工业制造等领域有广泛应用前景。(3)强思维升级:5.0版本在数学能力、复杂任务规划能力和工具调用能力上均有所增强,能够更好地处理数学问题、规划复杂任务及调用各种工具和资源,从而成为更高效的行业助手。 Q4:盘古大模型5.0有什么最新看点?2024年10月,中国信通院人工智能研究所联合40余家业界单位共同编制《面向行业的大规模预训练模型技术和应用评估方法第6部分:政务大模型》。华为云盘古大模型2024年首批参与对应测评,顺利完成政务大模型标准符合性验证,获当前业界最高卓越级(5级)评分。盘古政务大模型在模型平台、模型微调、模型能力、内容安全四项技术领域以及服务能力与生态合作,共计六项评估指标取得满分,成为本次评估中唯一技术+服务领域全部评估指标满分的厂商。 Q5:盘古大模型5.0的推出,哪些标的有望受益?华为盘古大模型5.0的发布将推动AI产业发展,包括硬件、服务、行业应用及产业链相关企业将会受益。受益标的:科蓝软件、拓维信息、常山北明、软通动力、博彦科技、梦网科技、数字政通、神州数码、光环新网、赛意信息、彩讯股份等。 风险提示:市场竞争加剧、AI监管政策的收紧、算力资源不足、AI领域发展进度及需求不及预期。 Q1 盘古大模型为何能在AI领域中脱颖而出? 1.1.盘古大模型为何能在AI领域中脱颖而出? 盘古大模型 盘古大模型在处理复杂、不均匀的3D气象数据时,创造性地提出了适应地球坐标系统的三维神经网络(3DEarth-Specific Transformer),并使用了层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。这一创新使得盘古大模型在气象预报领域取得了显著成果,并在《Nature》正刊上发表了相关研究成果。 盘古大模型集成了华为云团队在AI领域数十项研究成果,并且受益于华为的全栈式AI解决方案,与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts平台深度结合。 全系列、多模态、强思维 生态建设与合作伙伴 华为云的全栈AI能力 ISV生态建设 与鸿蒙系统的协同 华为云构建了包括AI原生的云基础设施、数据湖和数据治理、算子库、算法框架以及AI开发平台和大模型的全栈工业AI能力。其云基础设施架构CloudMatrix将CPU、NPU、DPU、存储和内存等资源进行了全面互联和池化,为AI应用提供了强大的算力支持。 华为云在to B和to G领域有着深厚积累,同时多年来致力于ISV(独立软件提供商)的生态建设。中软动力、软通动力、南威软件等深耕各行业的软件服务商都是华为云的合作伙伴,共同推动了盘古大模型的行业落地和应用。 鸿蒙系统作为华为面向万物互联时代的原生操作系统,与盘古大模型形成了良好的协同效应。 资料来源:华为官网、Nature、凤凰网、中国基金报、网易、CSDN、东兴证券研究所 1.2.盘古大模型的架构 1.3.海外龙头对标:GPT-4 Turbo模型 GPT-4-Turbo的优势 GPT-4-Turbo的优势包括:增强的上下文处理能力(可处理高达128K个token),更新的知识库(包含至2023年12月的信息),更低的成本效益,以及新功能集(如JSON模式、可复现输出等),这些使其在处理复杂任务时更准确、高效,并吸引更多开发者使用。 根据OpenAI自己发布的最新测试结果,从这个评测看,在数学图例方面,GPT-4-turbo-2024-04-09版本的模型 都有不同程度的提高,最高可以提升19% 对盘古大模型的启示 华为盘古大模型可从GPT-4-Turbo的成功中汲取经验,注重技术创新与升级,紧密贴合市场需求,加强品牌建设,并积极推动应用落地。 资料来源:OpenAI、数据学习、网易、电子技术设计、东兴证券研究所 Q2 盘古大模型推出的背景和发展如何? 2.1.华为云盘古大模型推出背景 数字化转型趋势 市场需求多元化 技术创新与突破 2024年10月,世界经济论坛(WEF)公布我国有72家入选“灯塔工厂”,占全球“灯塔工厂”总数的 •行业应用广泛•定制化需求增加•新兴应用场景不断涌现•技术融合与创新 小数据与优质数据应用、人机对齐技术、可解释性模型增强、大规模预训练模型优化、全模态大模型发展、具身智能与实体AI系统、以及量子计算与AI的结合等,这些创新正引领AI技术迈向新高度。 42%,位居全球首位。 产业生态构建 竞争格局多元化 AI技术逐渐成熟 截至2023年,我国AI大模型行业规模已达到147亿元,且近三年复合增速高达114%。金融、政府、影视游戏和教育领域是大模型渗透率最高的四大行业,渗透率均超过50%。预计到2028年,我国AI大模型行业的市场规模将突破千亿元,五年复合增速将超过50%。 国内市场:大模型发展势头尤为迅猛。大型语言模型可分为四大竞争派系:互联网公司(如百度、阿里、腾讯、华为等)、AI公司(如澜舟科技、昆仑万维等)、学术及科研机构(如清华、北大、中科院等)以及行业专家团队初创公司。目前国内已经有300多个AI大模型,同台竞技。 华为基于鲲鹏与昇腾两大基础芯片族,构建了包括欧拉、鸿蒙等基础软硬件在内的开源开放生态。其中,鲲鹏面向通用计算,昇腾面向人工智能计算。 资料来源:人民网、前瞻网、CSDN、《瞭望》(郭方达)、澎湃新闻、中国科学技术协会、网易、东兴证券研究所 2.2.盘古大模型发展历程 盘古大模型是由华为公司开发的一款基于深度学习和自然语言处理技术的中文AI模型,涵盖了自然语言处理(NLP)、计算机视觉(CV)和科学计算等多个领域,拥有超过1.7万亿个参数,是目前世界上最大的中文AI模型之一。盘古大模型采用完全的分层解耦设计,包括L0层的5个基础大模型、L1层的N个行业通用大模型、以及L2层可以让用户自主训练的更多细化场景模型。 持续创新与突破 持续优化 面向行业的全面升级 技术深化与领域拓展 盘古大模型2.0版本发布。华为与能源集团等合作伙伴开始将大模型初步应用于企业、工业和科学研究。 资料来源:华为官网、环球科技网、百度百科、CSDN、东兴证券研究所 Q3 盘古大模型5.0有什么优势? 3.1.盘古大模型5.0的突出优势 盘古大模型5.0的训练过程 华为自研盘古大模型,跳级迭代:Pangu3.0Pangu5.0 华为云已经从盘古3.0时代的3T Tokens的数据,演进到了盘古5.0的10T Tokens的高质量数据,其中合成数据占比超过了30%。盘古大模型5.0采用了优质的、面向高阶能力的数 据 合 成 方 法。这 种 方 法 以 弱 模 型 辅 助 强 模 型 的weak2strong方式,通过迭代式合成高质量数据,确保数据的完整性、相关性和知识性不弱于真实数据。 数据高效 参数高效 盘古大模型5.0提出了基于Transformer架构的新型大语言模型架构盘古π。这一新架构通过增广残差连接和改造激活函数等方式,解决了Transformer架构中的特征坍塌问题,提升了模型的精度。 华为云通过优化昇腾AI云服务,显著提升了模型训练的稳定性和效率,如万亿参数模型训练可40天无中断,集群故障恢复时间缩短至10分钟。此外,华为云创新推出CloudMatrix云基础设施,实现多元算力对等全互联,将AI算力从单体提升至矩阵级别。为解决“内存墙”问题,华为云还发布了EMS弹性内存存储服务,利用显存扩展等技术释放极致算力。 算力高效 在数学能力、复杂任务规划能力和工具调用能力上均有所增强,能够更好地处理数学问题、规划复杂任务及调用各种工具和资源,从而成为更高效的行业助手。 3.2.全系列升级:不同参数规格模型适配不同业务场景 5.0版本不再局限于单一模型,而是推出了不同参数规格的模型,以适配不同的业务场景。包括PG-Alpha、PG-Beta、PG-Gamma、PG-Delta等不同规格的模型,以适配不同的业务场景。 结合物理世界:盘古大模型5.0在全系列升级中,更加注重与物理世界的结合。例如,推出了PG-Radar系列模型,将AI与物理世界更好地结合起来,实现智能的万物互联。这一技术创新不仅提升了模型对物理世界的理解能力,也为边缘智能等特定场景提供了更好的解决方案。 3.3.多模态升级:精准理解和可控生成 5.0版本不仅支持文本、图片、视频等常见模态,还新增了对雷达、红外、遥感等模态的支持,且在多模态理解和生成能力上均有显著提升,尤其在自动驾驶、工业制造等领域有广泛应用前景。 可控生成 精准理解 在内容生成方面,盘古大模型5.0采用了业界首创的STCG(Spatio Temporal ControllableGeneration,可控时空生成)技术,能够生成更加符合物理规律的多模态内容。这一技术使得盘古大模型在自动驾驶、工业制造、建筑等多个行业场景中都有广泛的应用前景。 除文本、图片、视频外,5.0版本还增加了雷达、红外、遥感等更多模态。 盘古大模型5.0版本演进了模型架构,提出了基于Transformer架构的新型大语言模型架构盘古π(PanGu-π),通过增广残差连接和新的级数激活函数等方式,大幅提升了模型的精度。 资料来源:华为、腾讯网、机器之心、东兴证券研究所 3.4.强思维升级,提升模型复杂推理能力 技术挑战 关键结果 关键技术MindStar 华为云提出基于多步生成和策略搜索的MindStar方法。该方法首先把复杂推理任务分解成多个子问题,每个子问题都会生成多个候选方案,通过搜索和过程反馈的奖励模型,来选择最优多步回答的路径。华为云提出基于多步生成和策略搜索的MindStar方法。该方法首先把复杂推理任务分解成多个子问题,每个子问题都会生成多个候选方案,通过搜索和过程反馈的奖励模型,来选择最优多步回答的路径。 目前在单步任务