AI智能总结
研究范畴及目的 2018年,OpenAI发布第一个生成式预训练模型GPT-1,模型参数量达到1.17亿,开启了AI大模型的训练热潮;2022年底,ChatGPT的火爆,吸引了全世界对大模型的广泛关注,也激发了中国AI大模型发展热潮。2023年3月中旬,百度发布大语言模型产品文心一言,拉开了国内AI大模型产业“百模大战”的序幕,之后通义千问、盘古大模型、星火认知大模型、360智脑、豆包等纷纷问世。2024年中国AI大模型产业落地明显加速,AI大模型产品化、商业化和产业化的发展脉络基本形成。 AI大模型是指拥有亿级以上参数的深度学习模型,从应用场景角度可分为通用大模型和垂直大模型,其中垂直大模型又可以分为行业大模型和垂直场景大模型。通用大模型,聚焦基础层和技术攻关;垂直大模型,聚焦垂直领域解决方案,在通用大模型基础上开发行业和场景专用模型,面向政务、金融、医疗、教育、交通等垂直行业和营销、客服、运营等通用场景。 2024年以来,我国AI大模型的产业应用已经迅速展开,本报告通过调研中国AI大模型产业发展和市场应用,梳理AI大模型的发展历程、产业生态、商业模式、行业应用、市场规模、发展趋势等,并对典型垂类行业和场景应用案例进行剖析,以期达到以下目的: 研究梳理中国信创产业发展的背景、历程、现状和趋势;重点分析基础设施-信创云、基础软件-数据库、应用软件-CRM、信息安全-安全软件四大领域中代表细分场景的发展现状与应用;深入调研甲方和资本市场,挖掘出行业里产品成熟、口碑良好、具有特色的优秀服务商与实践案例。通过研究AI大模型产业的发展历程、产业生态、商业模式、行业和场景应用等,帮助企业了解AI大模型产业的发展脉络和发展方向;重点分析AI大模型产业的市场规模、发展驱动、市场应用、发展趋势,帮助AI大模型企业把握市场需求动向和发展趋势;深入调研AI大模型的典型行业和场景应用,挖掘行业里应用相对成熟、落地价值度高、市场反馈良好的优秀服务商与实践案例,为客户产品选择提供参考。 目录CONTENTS 02发展现状1.TOP5大模型应用行业:互联网、金融、医疗、教育、政务 01研究背景 2.国产大模型已大幅降价,为广泛商业化应用奠定基础3.中国AI大模型产业图谱4.AI大模型商业化落地:55%为定制化模式、40%-45%为API及订阅模式5.五种部署方式:直接调用、能力嵌入、扩展应用、定制模型、全栈构建6.2024年AI大模型应用市场规模约157亿元,2022-2027年复合增长率达148%7.未来3年,中国AI大模型产业将逐步进入需求侧驱动阶段 1.AI大模型可按照应用领域和输入数据类型进行分类2.至2024年中国AI大模型产业发展加速进入商用阶段 03应用场景及案例 1.AI大模型在互联网、政务、金融等行业应用场景日益丰富2.金融行业痛点及解决方案3.医疗健康行业痛点及解决方案4.教育行业客服场景痛点及解决方案5.政务领域市场监督管理场景痛点及解决方案6.零售消费行业痛点及解决方案7.制造行业知识管理场景痛点及解决方案 04发展趋势及挑战 1.AI大模型四个主要技术方向2.融合应用软件、智能助手和AI Agent是AI大模型市场应用的三个主要方向3.缺乏高质量数据集是大模型商业落地面临的关键挑战 研究背景 定义及分类 AI大模型可按照应用领域和输入数据类型进行分类 AI大模型是指拥有亿级以上参数的深度学习模型。AI大模型利用深度学习算法和人工神经网络技术等AI技术,通过学习大量的数据提升预测能力,其性能与模型的参数规模、数据集大小和训练用的计算量之间存在幂律关系;AI大模型基于注意力机制,通过在大规模、多元化的无标注数据集进行训练,具有较强泛化能力,应用在广泛的场景和任务。按输入数据类型,AI大模型分为语言大模型,视觉大模型、多模态大模型等;从应用领域角度分类,AI大模型分为通用大模型、行业大模型、垂直大模型。 在多个领域和任务上通用,具有基础的认知能力,各学科知识都懂一点;通用大模型就像完成了大学前素质教育阶段的学生。 针对特定的行业或领域的大模型,通常使用行业相关的数据进行预训练或微调,来提高在该领域的性能和准确度;行业大模型就像选择了专业的大学生,对所在专业领域的知识有了更深入的了解。 针对特定任务或场景的大模型,使用更加专业的知识和数据进行预训练和微调,在专业任务上的性能和效果更优;垂直大模型就像研究生,在所在具体领域有了比较深入的研究。 通过处理大量文本数据来理解和生成人类语言的大模型,执行自然语言处理任务,如文本分类、问答、对话、摘要总结等;常见的语言大模型包括ChatGPT、文心一言、讯飞星火等。 是一种基于大规模数据和强大计算能力训练的深度学习模型,通过模拟人类视觉系统的工作原理,通过复杂的神经网络结构,实现对图像和视频数据的高度识别、分析和表达的效果;常见的视觉大模型包括智谱CogVLM、书生·视觉大模型等。 多模态大模型指的是将文本、图像、视频、音频等多模态信息联合起来进行训练的模型;典型的多模态大模型包括腾讯的hunyuan-vision、商汤科技的日日新等。 发展历程 至2024年中国AI大模型产业发展加速进入商用阶段 1956-2006年,深度学习和神经网络技术的提出和发展,为AI大模型的出现奠定了技术基础,大模型技术萌芽开始出现;2006年后自然语言处理技术、Transformer架构的发展,为大模型预训练算法技术和架构奠定了基础;2018年OpenAI和Google分别发布GPT-1与BERT,预训练大模型成为自然语言处理领域的主流;2022年底,OpenAI推出ChatGPT引发全球大模型发展热潮,2023年中国国内大模型训练开始井喷,出现“百模大战”现象;2024年中国政策加大行业落地推动力度,商业发展加速。 •1956年:约翰·麦卡锡首次提出“人工智能”概念,标志着AI领域的诞生 •1998年:法国学者YannLeCun等人构建LeNet-5,标志着机器学习从浅层模型向深度学习模型的转变,为自然语言处理和计算机视觉等领域的研究奠定了基础•2013年:Word2Vec模型诞生,提出将单词转换为向量的“词向量模型”,推动了自然语言处理的发展•2014年:对抗式生成网络(GAN)诞生,标志着深度学习进入了生成式模型研究的新阶段•2017年:Google提出了基于自注意力机制的Transformer架构,为大模型的预训练算法架构奠定了基础•2018年:OpenAI和Google分别发布了GPT-1与BERT,标志着预训练大模型成为自然语言处理领域的主流•2020年:OpenAI推出了GPT-3模型,参数规模达到了1750亿,在零样本学习任务上实现了巨大性能的提升 •2024年1-7月,中国央国企采购大模型项目数量已超过950个 •2023年 :GPT-4发布,具备了多模态理解与多类型内容生成能力,进一步推动了大模型技术的发展 •截至2024年11月,中国获得备案的大模型数量达到309个,中国大模型开始在垂类行业众多场景落地 •2023年:中国掀起“百模大战”,发布各类大模型数量超过100个,涵盖通用大模型、行业大模型、基于通用大模型或行业大模型的应用服务型大模型等 •截止2024年底,中国大模型产品使用价格进一步下降,为大模型广泛商用落地提供了基础 AI大模型产业发展现状 大模型发展与应用结构 TOP5大模型应用行业:互联网、金融、医疗、教育、政务 我国AI大模型需要依照《生成式人工智能管理暂行办法》进行备案,截止到2024年11月,已有3批次共计309个大模型通过国家互联网信息办公室备案。从应用类型看,通用大模型占比28%,垂类大模型占比72%;从应用领域看,互联网行业、金融行业、医疗行业、教育行业、工业行业大模型占比均超过10%。 洞察一:得益于语言大模型的能力和丰富的应用场景,语言大模型的数量明显多于其他模态;随着大模型多任务适应性和多模态能力持续增强,对齐视觉特征和文本特征,实现跨模态的统一理解,并根据指令创造新的内容或增强现有数据表达,成为当前大模型创新的焦点。 洞察二:闭源大模型的商业化输出和开源大模型的涌现,推动大模型落地门槛持续降低,垂直行业成为创新的重要赛道,吸引了产业资本支持;2024年,我国垂直大模型涌现,快速向垂直行业渗透。 洞察三:垂类大模型覆盖互联网、金融、医疗、教育、政务等众多行业;目前垂类大模型行业用户对知识助手、智能客服、智能营销、编码助手等应用接受程度高,同时对数据分析、办公助手等应用抱有较高期待。 产品发展 国产大模型已大幅降价,为广泛商业化应用奠定基础 当前AI大模型产品进化路线有两条,一是通过增加模型参数量、扩大数据集、提升训练计算量来获得性能更强大的大模型产品;二是通过优化模型架构适应性和计算效率,获得更具性价比的产品,如70B参数的模型,通过优化架构和训练策略,可获得接近或超越更大规模模型的性能。随着大模型能力和性价比的提升,国产大模型厂商开始大幅降价,截止到2024年底,我国典型AI大模型的价格下降至0.5元/百万Tokens以内,为大模型应用的广泛落地打下了基础。 商业化模式 AI大模型商业化落地:55%为定制化模式、40%-45%为API及订阅模式 AI大模型市场应用的商业化模式逐渐清晰: 定制化模式面向大型政企:大型企业AI大模型应用时,更倾向于定制化,并采用本地化部署模式;例如浦发银行最新招标的2024年大模型应用体系建设项目,采购定制化算力设备和大模型软件,且要求算力设备和大模型软件满足信创要求。当前,大模型技术和产品迭代迅速,定制化模式下,客户会要求大模型服务商定期迭代更新服务。 API及订阅模式适用于中小企业及机构:采用API及订阅模式采购大模型服务,具有节省资源、快速集成、实时更新和可扩展性强等优势,适用于中小型企业;如豆包大模型等采用API对外提供问答等服务。此外,企业用户调用API需要注意数据安全和隐私保护。 嵌入智能终端和APP中收取广告费的模式逐渐落地:随着大模型应用的普及,将大模型嵌入智能终端和APP中,向广告主收取广告费的模式,将成为大模型产品变现的重要方式,未来大模型应用将成为互联网广告提升和优化流量的重要抓手。2024年11月,苹果与百度达成合作,国行版iPhone接入百度最新的AI大模型Ernie 4.0,iPhone将能够提供更精准、更智能的语音助手、图像识别和数据处理等功能,将拉开大模型规模化嵌入智能终端、收取广告费的序幕。 AI大模型应用落地路径 五种部署方式:直接调用、能力嵌入、扩展应用、定制模型、全栈构建 大模型应用需求落地一般分为四个阶段:(1)场景需求评估:评估企业当前的大模型技术、应用场景和能力,做好大模型应用落地的准备,包括技术能力评估、应用场景梳理、能力分析等。(2)部署能力建设:设计和构建符合战略规划和业务需求的大模型能力体系,包括大模型建设方案设计、系统研发和功能测试、数据与算法准备等。(3)大模型应用部署:将大模型部署到具体的业务场景中,提供定制化的智能解决方案,实现大模型的商业化应用,包括定制化优化与应用开发、效能评估与闭环管理、全生命周期管理等。(4)大模型运营管理:建立大模型运营管理体系,保障大模型的长效运行,并通过实时监测和反馈机制提升运营效率,包括实时监测与动态追踪、持续优化与管理体系完善等。 市场规模 2024年AI大模型应用市场规模约为157亿元,2022-2027年复合增长率达148% 根据第一新声智库研究,2022-2027年中国AI大模型应用市场规模复合增长率将达到148%,至2027年,AI大模型市场规模将达到1130亿,AI大模型行业达到盈利临界点。 Ø洞察一:2024年,中国AI大模型商用加速,根据第一新声研究院不完全统计,2024年公开的大模型中标项目超过1000个,整体应用市场规模将达到157亿,市场用户主要以定制化和API调用模式为主;大模型应用市场规