AI智能总结
2023年中国AI开发平台市场报告 人工智能、AI开发平台、机器学习平台、机器学习 报告说明———— 沙利文联合头豹研究院谨此发布中国人工智能系列报告之《2023年中国AI开发平台市场报告》年度报告。本报告旨在分析在中国AI开发平台市场的现状、应用前景、技术动向及发展趋势,并识别AI开发平台市场竞争态势,反映该细分市场领袖梯队厂商的差异化竞争优势。 沙利文联合头豹研究院对在AI开发平台进行了下游用户体验调查。受访者来自金融、电商零售、政府与公共服务、商业与消费服务等不同行业,所在公司规模不一,细分领域有别。 本市场报告提供的中国AI开发平台发展趋势分析亦反映出AI开发平台行业整体的动向。报告最终对市场排名、领袖梯队的判断仅适用于本年度中国AI开发平台市场发展周期。 本报告所有图、表、文字中的数据均源自弗若斯特沙利文咨询(中国)及头豹研究院调查,数据均采用四舍五入,小数计一位。 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系弗若斯特沙利文及头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。未经弗若斯特沙利文及头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,弗若斯特沙利文及头豹研究院保留采取法律措施、追究相关人员责任的权利。弗若斯特沙利文及头豹研究院开展的所有商业活动均使用“弗若斯特沙利文”“沙利文”“头豹研究院”或“头豹”的商号、商标,弗若斯特沙利文及头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其他任何第三方代表弗若斯特沙利文或头豹研究院开展商业活动。 研究框架 ◆中国AI开发平台行业综述 •定义与研究范围•发展历程•价值效益 ◆中国AI开发平台行业分析 •政策分析•发展趋势•竞争研判•竞争壁垒 ◆中国AI开发平台行业产业链分析 •产业链图谱•上游分析-算法与算力•上游分析-云原生技术架构•中游分析-参与者类型•中游分析-商业模式•下游分析-业务场景•下游分析-行业应用 ◆中国AI开发平台行业场景应用分析 •金融、泛娱乐、教育、医疗、电商•交通、物流、政务、消费电子、零售 ◆中国AI开发平台市场竞争分析 •中国AI开发平台评价维度说明•中国AI开发平台市场综合竞争表现•中国AI开发平台市场领导者厂商 ◆方法论 ◆法律声明 章节一行业综述 ❑1.1定义与研究范围❑1.2发展历程❑1.3价值效益❑1.4市场规模 中国AI开发平台行业综述——定义与研究范围 关键发现 AI开发平台是一个提供整一套AI应用开发流程支持,帮助开发者降低开发门槛,并快速集成数据处理、模型搭建和应用部署的一站式服务工具平台 机器学习框架:Tensorflow、Pytorch、Kersa、Scikit-learn、PaddlePaddle、MindSpore 云原生架构:微服务、容器、Serverless、DevOps IaaS云计算基础设施:基础硬件+云计算基础架构 AI开发平台的开发流程包含数据标注、模型建立、模型训练、模型评估、和模型部署五个基本模块。通过五个模块的搭建流程,使用者可以在低代码且无需担心底层基础设施运维的环境下开发AI应用。 ◼模块一:数据处理 数据的质量是机器学习算法搭建的重要核心部分,数据质量的好坏将直接决定机器学习模型的性能。AI开发平台的数据处理环节通常包含数据采集、数据筛选、数据标注、数据分组以及数据增强五个功能环节。通过这五步,AI开发平台的使用者可以实现高质量的数据准备和输出,为下一步的模型建立做好充足的准备。 ◼模块二:模型搭建 模型搭建是在数据准备好后进行模型筛选和参数调配的过程,根据清洗好后的数据特征,AI开发平台会提供不同的算法模型供开发者选择。AI开发平台的模型搭建环节包括模型选择和参数调配。模型选择可以通过四步来完成:1、匹配模型:AI开发平台会通过开发者提供的数据推荐和匹配合适的算法模型。2、设置架构及参数:选择好合适的模型后需要对该模型进行特定的参数调配。以随机森林算法为例,开发者需要预设K值;以神经网络为例,开发者需要预设神经层数、节点数、激活函数等。3、编译模型:在训练开始之前,开发者还需要确定好要添加 中国AI开发平台行业综述——定义与研究范围 关键发现 在AI开发平台开发AI应用可以分为五个步骤,分别为数据处理、模型搭建、模型评估、以及模型部署应用。开发者通过使用AI开发平台可以增强AI应用部署的效率、稳定性以及弹性伸缩能力 AI开发平台的定义框架 的优化器、一个损失函数、以及评估指标。优化器的作用是决定模型如何进行更新和修正的关键步骤,不同类型的优化器会对模型的训练速度和最终的准确度产生重要的影响;优化器的选择通常会因问题类型的不同、模型的复杂度、和训练数据的大小而决定。开发者需要在训练开始前筛选和测试不同的优化器,从而挑选出最合适的优化器以帮助提升后续训练的成果;损失函数的作用是用于度量模型预测结果和真实结果之间的差距;评估指标则是需要在训练开始确定好,从而可以在后续的训练中监控模型的性能和精确度,并决定何时可以真正的投入到实际应用中。 ◼模块三:模型训练 在准备好数据和匹配好模型之后,便可开始投入模型训练。模型训练通常会将数据集切分为两组,一组为训练集,一组为验证集。训练集的数据用来训练模型,通常由80%的数据量组成;验证集的数据用来监控模型的性能,通常由20%的数据量组成。模型训练这一步通常会进行多次的重复迭代。根据每次的训练结果,损失函数会度量模型预测结果和检验结果的差距,优化器会根据损失函数的值来更新模型的参数,以使损失值最小化。AI开发平台提供了丰富的模型库以及计算环境。开发者无需自行构建模型或搭建计算资源,大幅降低模型训练的门槛。 ◼模块四:模型评估 经过模型训练的多轮迭代,开发者可以通过预设的评估指标对模型的质量和性能进行评估。不同的训练模型需要用不同的指标进行评估,常见的评估指标有准确率、召回率等,复杂的评估指标包括AUC-ROC、F1分数等。AI开发平台为开发者提供了方便的用户界面和API,开发者无需自行编写评估代码便可对模型进行全面的质量评估。 ◼模块五:模型部署 当模型的性能达到可以应用的标准后,开发者便可以将训练好的模型打包上传至AI开发平台的模型库中。上传至库后,开发者需要创建部署设置,将训练模型转换成为AI应用。随后,AI开发平台会将AI应用部署为容器实例并注册外部可访问的推理API,以便开发者随时调用和运营。相比于独立运营,在AI开发平台上部署AI应用最主要的优势在于AI开发平台提供的弹性和稳定性。AI开发平台普遍具备强大的计算资源、存储能力、分布式架构、以及专业的运维团队。这些功能可以帮助AI应用的启动部署速度更快、运行的稳定性更高以及针对客流变化的应变能力更强。因此,AI开发平台成为了众多企业进行AI开发的首要选择方式。 中国AI开发平台行业综述——价值效益 关键发现 AI开发平台的核心价值点可以提炼为两个方面。一方面,AI开发平台可以大幅缩短企业部署AI应用的时间,帮助企业更好地应对变幻莫测的市场。另一方面,AI开发平台可以提高各独立环节间的合作效率 ◼缩短企业AI模型的部署周期 缩短70%数据标注时间 传统机器学习开发的流程非常耗时,因为传统的开发方式是独立且难以泛化的。每一次建立AI模型都需要从头到尾进行大量的特征工程、人为标准设定、流程分类、任务匹配等模块,导致了传统机器学习项目的长时耗和高复杂度的特质。 根据企业调查,超过64%的企业需要在90天的周期内上线部署AI应用开发程序。只有5%的企业将部署周期设定为了一年以上,这为当前的AI应用开发部署效率提出了高要求。企业对开发高效率的诉求主要来源于高速变化的市场需求,过长的开发周期无法匹配中小企业对业务灵活性的变更需求。 提升80%AI应用开发效率 因此,AI开发平台成为了众多AI应用开发者的首要选择,AI开发平台的内置流程规划化模块可以帮助开发者缩短超70%的数据标注时间,综合提高AI的应用开发效率超80%,极大程度地缩短了不同企业AI应用的部署周期。 ◼提高不同AI应用开发中不同角色协同的效率 通过AI开发平台的流程化管理平台,数据工程师、机器学习架构师、商业智能开发师等多个不同的开发角色可以进行工作流上的无缝协作,让业务、数据、算法、运维等多个角色能进行更高效率的协作,提升价值产出。由于不同角色的工作流涉及到转化、调优、设计等各自独立的步骤,统一规范的自动工作流可以提高团队超90%的合同协作效率。 提升90%多角色合作效率 章节二行业分析 ❑2.1政策分析❑2.2发展趋势❑2.3竞争研判❑2.4竞争壁垒 中国AI开发平台行业发展分析——发展趋势 关键发现 中国AI开发平台行业未来的发展趋势有四个方向,分别是基础硬件的国产化、国资企业的市场主流化、AI应用场景加速拓宽以及开发流程持续的解耦化 ◼AI开发平台的基础硬件会更多地使用国产化硬件,推动国产硬件的发展 近年受制于全球新冠疫情的发展和国际形势的紧张态势,AI开发平台上游的基础设施的成本持续走高,芯片供给承压,为中国AI开发平台带来不良的影响。为了产业能够持续健康的发展,发展硬件国产化成为未来的重要战略目标。AI开发平台将受国家号召,更多进行的国产硬件的采购,逐步降低对海外硬件的高度依赖。 ◼国资背景企业在AI开发平台的市场表现会更优 国资背景企业短期内的市场表现会更优秀,主要原因是数据安全问题持续受到高度关注。随着不断出现国家机密和隐私数据泄露的事件发生,涉及政府和大型商业企业的业务监管变得更加严厉。由于AI开发平台涉及到大量的隐私数据输入和产出,将来更多的政府和大型企业会寻求国资背景的AI开发平台企业展开合作。 ◼AI开发平台的应用场景在未来数年内有望迎来爆发式拓宽 大模型的突破让AI应用的潜力得到进一步释放。结合大模型开发能力的AI开发平台将在政务、交通、医疗、教育、泛娱乐等多个行业拓宽应用场景,打通创新式的业务,帮助企业更好地服务客户和推动业务增长。 ◼AI开发平台的协作方式将继续加强解耦性 AI开发的项目难度很大,通常原因是一套完整的AI开发流程涉及多个任务角色,包括架构师、BI分析师、企业负责人、数据科学家、ML模型专家等。传统的AI开发流程多为紧耦合,一环的问题会影响到其它环节,从而导致项目推进速度和完成难度很大。云原生架构的出现让AI开发平台的解耦性得到进一步加强,不同环节的工作可以更加独立的运行。未来,随着云原生技术进一步渗透,AI开发平台的协作方式将会以更加解耦的方式呈现。 中国AI开发平台行业产业链中游分析——竞争研判 关键发现 中国AI开发平台的第一梯队为云计算基础设施成熟且具备丰富行业经验的企业,第二梯队为云计算厂商或在细分AI业务场景领先的平台型企业,第三梯队为AI垂直赛道的创业型公司 中国AI开发平台竞争格局研判标准 第一梯队 第二梯队 第三梯队 ◼具备一定云计算基础设施能力◼具备完整AI平台应用开发的PaaS层链路,且在细分的AI业务场景处在领先地位◼拥有成熟业务场景和行业解决方案 ◼具备AI开发平台的完整链路,但不提供计算基础设施服务◼AI开发平台业务的建立目的为带动现有其它业务发展,并非开发本身 通过市场口碑、产品丰富度、行业经验深度、基础设施成熟度、以及企业的营收规模综合考虑,最终评判具备提供AI开发平台能力厂商的综合竞争能力 ◼技术基础建设能力和市场开拓理解是评判AI开发平台厂商实力的核心要素 技术基础设施探究企业在AI开发平台技术基础设施的成熟度和完善性,主要考量点包括企业的云原生架构能力、企业提供的机器学习框架类型丰富度、和企业在计算资源收费方式的多样性。市场力探究企业在AI开发平台的市场口碑和下游应用沉淀情况,主要考虑点包括企业AI开发平台相关技术的社区口碑、业务场景的丰富度、行业解决方案的成熟度、客户案例数量