AI智能总结
IndustryResearchReportonLargeModelDirection 目录 一、大模型行业概览.....................................................................................................1 (一)大模型的起源.........................................................................................................1(二)大模型的定义.........................................................................................................1(三)大模型的发展历程.................................................................................................2(四)大模型的发展现状.................................................................................................2(五)机遇与挑战.............................................................................................................9(六)国内外大模型厂商总览.......................................................................................10 二、大模型人才现状...................................................................................................10 (一)人才发展现状.......................................................................................................11(二)人才发展建议.......................................................................................................18 三、国内主要厂商.......................................................................................................20 (一)百度:...................................................................................................................20(二)阿里:...................................................................................................................22(三)腾讯:...................................................................................................................24(四)字节跳动:...........................................................................................................25(五)华为:...................................................................................................................26(六)百川智能:...........................................................................................................27 四、结语.......................................................................................................................28 一、大模型行业概览 (一)大模型的起源 大模型的起源可以追溯到2012年。当时,深度学习领域取得了两个重要的突破:AlexNet和GPU的应用。AlexNet是一个包含5000万个参数的深度卷积神经网络,它在ImageNet图像分类竞赛中取得了很好的成绩。同时,GPU的应用也为大模型的训练提供了强大的计算能力。这两个突破为大模型的快速发展奠定了基础。 2017年,谷歌提出了Transformer结构,该结构成为了自然语言处理领域的重要里程碑。Transformer结构包含亿级别的参数,具有强大的语言理解能力,为自然语言处理领域带来了突破性的进展。 随着计算能力的提升和算法的优化,越来越多的公司和机构开始投入到大模型的研究中。2018年,脸书推出了FacebookAI大模型(又称ERNIE-Health),该模型包含33亿个参数,用于医疗健康领域的知识问答任务。2019年,谷歌推出了SwitchTransformer模型,该模型包含1.6万亿个参数,成为了目前最大的NLP模型之一。 (二)大模型的定义 1.大模型的概念 大模型是指具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。一般来讲,参数量超过10亿、具备泛化能力的模型,可以被称为大模型。 资料来源:百度:关于大模型的定义,海伯高斯研究团队整理 2.大模型的特点 1)参数规模巨大: 大模型可以处理更加复杂、庞大的数据集,从而获得更好的性能。缺点:大量的数据和参数会占用大量的内存空间。 2)深度结构复杂: 更好地捕捉数据中的复杂模式和特征,从而提高模型的准确性和性能。缺点:更加复杂和细致的计算,提高了时间和计算成本。 3)泛化能力(通用能力)强:大模型能够从已有知识中提取普适规律,并将其应用于新的情况和问题上。 4)语义理解与生成/自然性: 大模型能够更好地处理语言语义,生成更自然、连贯、富有逻辑的文本、图像、音频等内容。 (三)大模型的发展历程 (四)大模型的发展现状 1.产业规模 1)市场规模 从2023年3月开始,国内的AI大模型如雨后春笋般涌现。据统计,截至2023年7月底,中国累计已经有130个大模型问世;国外大模型发布数量累计达138个。 资料来源:海伯高斯研究团队整理 根据国际数据公司IDC预测,全球AI计算市场规模将从2022年的788.4亿人民币增长到2026年的4555.2亿人民币。其中,生成式AI计算市场规模将从2022年的60亿人民币增长到2026年的802.3亿人民币。 而中国庞大的市场需求和丰富的人才储备,为大模型的发展壮大提供了有利的客观条件,据专业机构预测,中国大模型产业市场规模2023年将达到147亿元人民币,并在2028年达到1179亿元。 资料来源:钛媒体国际智库,海伯高斯研究团队整理 资料来源:钛媒体国际智库,海伯高斯研究团队整理 从数量来看,截至目前,国内大模型发布数量与以美国为首的国外大模型差距不大,但从整体的影响力来看,国内大模型还没像OpenAI、谷歌一样形成世界性的影响力。此外,由于大模型对人才、资本和技术的制约,国内一级市场对大模型项目的投资并不如美国那样火热,国内更倾向于利用龙头企业的开源模型来做应用落地的创业。 2)产业价值链 海内外科技公司聚焦于大模型开发以及商业化落地,越来越多的知识计算能力融入到行业大模型中,行业AI应用的渗透率将全面提速。 大模型中的应用层和场景层,涵盖了金融、医疗、办公、影视、游戏、电商、广告、工业、芯片、算法平台等各个领域,目前各行业的大模型均有了长足进展。 资料来源:海伯高斯研究团队整理 大模型产业价值在于降低AI使用门槛,提升行业效率。 大模型拥有数据的强大处理和分析能力,能够处理和分析大规模、复杂的数据,从中发现隐含的模式和规律。这使得企业能够更准确地了解市场需求、优化业务流程,做出更明智的决策,提高效率和竞争力。 大模型的多模态能力为行业提供了更多的可能性,能够处理语音、图像、文本等不同类型的数据,并将它们综合起来进行分析和理解。这使得在跨行业合作和创新方面有了更广阔的空间。大模型还具备持续学习和自适应能力,随着不断的训练和迭代,大模型可以不断提升自身的性能和准确度,适应不断变化的业务需求和环境。这种灵活性和适应性使得大模型成为行业创新和优化。 3)资本投入 2023上半年,全球人工智能领域共计发生融资1387件,筹集融资金额255亿美元,平均融资金额达2605万美元。 2011-2023年共计3658个AI领域融资项目(仅统计500万以上融资金额的项目,且融资公司所在地为美国),美国AI领域融资项目数及融资金额稳步增长。2022年美国风投AI领域融资项目数为574个,2011-2022年CAGR达29.3%;2022年美国AI领域融资金额为243.5亿美元,2011-2022年CAGR达422.5% 资料来源:钛媒体国际智库,海伯高斯研究团队整理 2023上半年,国内人工智能领域共发生161起投融资事件,其中包括人工智能核心技术44起,人工智能基础支撑43起,人工智能应用场景40起,人工智能通用场景34起。较去年同期减少153起,同比下降49%;2023上半年度国内人工智能领域投融资交易事件涉及总金额61.74亿元,较去年同期减少99亿元,同比下降62%。毫不夸张地说,“百模大战”已开启。IDC预测,2026年中国AI大模型市场规模将达到211亿美元,人工智能将进入大规模落地应用关键期。 资料来源:钛媒体国际智库,海伯高斯研究团队整理 2.政策 针对目前国内大模型行业,国家本身持鼓励态度,并且在此基础上逐步明确监管,适当引导,当前地方政策以鼓励为主,中央政策关注事前规范。 今年四月底的中共中央政治局会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。五月初召开的第二十届中央财经委员会第一次会议指出,要把握AI等新科技革命浪潮。随后全国各地相继根据各自的情况和条件推出大模型扶持政策。 截至目前统计数据来看,国家共发布有关大模型行业的政策17条,其中地方16条,中央发布1条。这其中重点政策分别为: (五)机遇与挑战 1.机遇 TOC端: 改善自身产品,提高用户体验,吸引并留存用户,未来或基于流量向商家端变现,如百度文心,阿里淘宝问问。提供面向C端的AIGC工具,通过订阅模式变现,如百度文库、各家的A个人助理、文生图工具等。通过大模型增强自身产品竞争力,如讯飞的“智能办公本”和“AI学习机”。 TOB端: 大模型调用,做公有云,如AP1、精调大模型。私有云部署。大模型平台,提供数据、算力或精调、评测以及推理等服务,如百度、阿里、腾讯、字节和商汤。 2.挑战 表2:大模型行业可能面