AI变革行业创新发展 China and Global Large Language Model Industry中国と世界の大規模な言語モデル業界 撰写人:常乔雨 1报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,头豹研究院保留采取法律措施、追究相关人员责任的权利。头豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标,头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其他任何第三方代表头豹研究院开展商业活动。 头豹研究院 摘要 ◼2023年,中美两国在人工智能领域融资占主导,其中美国断层领先,中国紧随其后,凸显了两国在该领域的竞争格局 中国大模型市场目前呈现出数量庞大且高度竞争的特点,众多企业和研究机构纷纷涌入这一领域,推出了大量的大模型产品。截至2024年2月,中国已有超过130个大模型出现,创业参与者覆盖各大涵盖开源、闭源、二次开发及微调等,发布机构则遍布互联网科技巨头、云计算领先企业、综合人工智能公司、智能设备制造商以及数字基础设施提供商。然而,与国际厂商相比,中国在大模型技术方面仍存在一定的差距,这主要体现在算法的深度优化、数据处理效率、模型泛化能力以及创新应用场景等方面。 2023年,美国人工智能企业的融资额在全球总额中占据了显著优势,高达59%,形成了明显的断层领先态势。与此同时,中国作为追赶者,在人工智能融资市场中也表现出强劲势头,占据了16%的份额。其他国家在这一领域的融资相对较少,凸显了当前人工智能竞争主要集中在中美两国之间的格局。 ◼中国的大学研究机构和互联网大厂是全球AI2000人才榜单中中国顶尖AI人才的核心产出源 外国的大模型市场虽在数量上不占优势,市面上广为认知的基础大模型不超过10家,但其技术能力却极为强大。以GPT3.5为例,该模型凭借卓越的性能和广泛的应用场景,吸引了庞大的用户群体,其用户数量之多足以证明外国在大模型技术领域的深厚实力。这种实力不仅体现在算法的高效优化和数据处理能力上,更凸显在模型通用性、稳定性以及创新应用领域的开拓上,为中国大模型市场的发展提供了有力的借鉴和学习的目标。 在全球AI2000人才榜单中,中国的大学机构成为人才贡献的主力军。其中,清华大学以显著优势位居榜首,2023年贡献的AI人才超过34人次,独占鳌头。浙江大学和中国科学院紧随其后,位列贡献AI人才的前三甲。此外,中国的互联网巨头如京东、腾讯、百度等也在此榜单中占据一席之地,成为AI人才的另一重要来源。综上所述,中国的大学研究机构与互联网大厂共同构成了中国顶尖AI人才的核心产出基地。 研究目的 •了解中外大模型的发展差异 研究目标 •了解中外大模型国家发展政策•知悉中外大模型人才特点•探析中外大模型产业发展特点•总结中外大模型发展核心差异点 本报告的关键问题 •中外大模型的发展如何?目前处在发展演变的哪一个阶段?•中外大模型发展的核心差异点有哪些?是什么因素造就了这些差异点?•中外各国在政策制定方面是怎样的?这些政策差异的考量点是怎么样的?什么因素造就了这样的结果? Chapter1中外大模型发展实践探析 ❑中国大模型市场呈现出数量众多、竞争激烈的态势,而外国大 模 型 市 场则 以 有 限的数 量 展 现 了强 大 的技 术实 力,如GPT3.5的广泛应用,两者各具特色,共同推动全球大模型领域的发展。 ❑受宏观经济环境影响,2022年人工智能企业的融资量呈放缓趋势。与此同时,其占全球风险投资金额的比重呈逐年上升趋势。2023年,美国的AI企业融资的金额占全球总金额的59%,断层领先于其他国家。 ❑按国家来看,美国当前的AI人才数量遥遥领先于其他国家。中国当前的AI人才数量位居全球第二;其中中国的大学研究机构和互联网大厂是全球AI2,000人才榜单中中国顶尖AI人才的核心产出源。 中外大模型发展实践探析——中外大模型厂商图谱 •中国大模型市场呈现出数量众多、竞争激烈的态势,而外国大模型市场则以有限的数量展现了强大的技术实力,如GPT3.5的广泛应用,两者各具特色,共同推动全球大模型领域的发展 中外大模型产业对比 中国大模型(部分) ◼中国大模型市场数量庞大且竞争激烈,但与国际厂商相比,在算法优化、数据处理、模型泛化及创新应用等技术方面仍存差距。 中国大模型市场目前呈现出数量庞大且高度竞争的特点,众多企业和研究机构纷纷涌入这一领域,推出了大量的大模型产品。截至2024年2月,中国已有超过130个大模型出现,创业参与者覆盖各大涵盖开源、闭源、二次开发及微调等,发布机构则遍布互联网科技巨头、云计算领先企业、综合人工智能公司、智能设备制造商以及数字基础设施提供商。然而,与国际厂商相比,中国在大模型技术方面仍存在一定的差距,这主要体现在算法的深度优化、数据处理效率、模型泛化能力以及创新应用场景等方面。 数量庞大 国际大模型(部分) ◼外国大模型市场虽数量有限,但技术实力强大,如GPT3.5的广泛应用和庞大用户群,彰显其在中国大模型市场发展中的借鉴与学习价值 外国的大模型市场虽在数量上不占优势,市面上广为认知的基础大模型不超过10家,但其技术能力却极为强大。以GPT3.5为例,该模型凭借卓越的性能和广泛的应用场景,吸引了庞大的用户群体,其用户数量之多足以证明外国在大模型技术领域的深厚实力。这种实力不仅体现在算法的高效优化和数据处理能力上,更凸显在模型通用性、稳定性以及创新应用领域的开拓上,为中国大模型市场的发展提供了有力的借鉴和学习的目标。 技术领先 中外大模型发展实践探析——国际大模型发展历程 •国际大模型趋势中,Decoder-only因其在文本和自回归建模方面卓越性能逐渐成为主流。这种架构能更自然处理序列数据,生成高质量文本,且灵活性和通用性更强 ◼Decoder-only架 构 因 其 卓 越 的 文 本 生 成 和 自 回 归 建 模 性 能,正 逐 渐 取 代Encoder和Encoder-decoder架构,成为大模型领域的市场主流 在当前国际大模型发展趋势中,以Encoder和Encoder-decoder为架构的模型数量逐渐减少,而Decoder-only架构正逐渐成为市场主流。这一现象主要归因于Decoder-only架构在文本生成和自回归建模方面的卓越性能。这种架构能够更自然地处理序列数据,生成连贯、高质量的文本输出,并且在处理复杂任务时表现出更强的灵活性和通用性。相比之下,Encoder和Encoder-decoder架构在某些特定任务上可能表现出局限性,导致它们的应用范围相对较窄。因此,随着市场对更高效、更灵活的模型架构的需求不断增长,Decoder-only架构正逐渐成为大模型领域的首选架构。 中外大模型发展实践探析——中国大模型发展历程 •中国大模型以Decoder-only架构为主,迅速崛起并展现出三大趋势:强大的语言大模型满足中文处理需求,多模态大模型革新交互与推荐领域以及行业小模型为各行业提供精准高效服务 ◼中国大模型以Decoder-only架构为基石,呈现出语言大模型、多模态大模型和行业小模型三大发展趋势,共同推动了中国在大模型领域的迅速崛起和未来的广阔前景 尽管中国大模型相较于国际大模型的起步时间稍晚,但凭借着以Decoder-only为主的灵活架构,中国在大模型领域取得了令人瞩目的进展。特别值得一提的是,中国大模型的发展呈现出三大鲜明趋势:首先是语言大模型,在中文处理方面展现出强大的实力,满足了日益增长的自然语言处理需求;其次是多模态大模型,通过融合文本、图像、音频等多种数据类型,为智能交互和内容推荐等领域带来了革命性的变革;最后是行业小模型,这些针对特定行业优化的模型,为金融、医疗、教育等行业提供了更加精准和高效的服务。这三大趋势共同推动了中国大模型的蓬勃发展,并预示着中国在该领域未来的巨大潜力。 中外大模型发展实践探析——美国AI领域融资情况 •受宏观经济环境影响,2022年人工智能企业的融资量呈放缓趋势。与此同时,其占全球风险投资金额的比重呈逐年上升趋势。2023年,美国的AI企业融资的金额占全球总金额的59%,断层领先于其他国家 ◼尽管面临宏观政策调整等挑战,人工智能领域的企业融资在全球风险投资中的份额持续增长。在大模型技术的推动下,2023年风险投资案例数量和金额均呈现上升趋势 宏观政策调整等多重因素导致全球对人工智能企业的风险投资放缓,但人工智能领域企业融资在全球风险投资中的占比仍逐年上升。2022年全球风险投资案例达2,956起,披露总额为458亿美元。而2023年,受大模型推动,风险投资案例数量呈现回暖趋势,已披露投资金额折合496亿美元。 国际AI领域融资占比 2023年,中美两国在人工智能领域融资占主导,其中美国断层领先,中国紧随其后,凸显了两国在该领域的竞争格局 2023年,美国人工智能企业的融资额在全球总额中占据了显著优势,高达59%,形成了明显的断层领先态势。与此同时,中国作为追赶者,在人工智能融资市场中也表现出强劲势头,占据了16%的份额。其他国家在这一领域的融资相对较少,凸显了当前人工智能竞争主要集中在中美两国之间的格局。 中外大模型发展实践探析——中国AI领域融资数量 •中国人工智能行业在2021年融资高峰后有所回落,但投资者兴趣未减,融资事件总数保持稳定。同时,AI企业A轮前融资频率逐年上升,2023年受大型模型推动增长显著,展现了AI领域的创业机遇和热度 ◼尽管中国人工智能行业在2021年融资额达到高峰后有所回落,但融资事件总数保持稳定,显示出投资者对该行业的持续关注 中国人工智能行业在过去六年里,其融资规模经历了显著的变化,特别是在2021年,该行业的融资额达到了一个历史性的高峰。然而,随后的趋势显示,融资金额有了大幅度的回落。尽管如此,从融资事件的总数来看,这一指标在过去六年中维持了相对稳定的水平,表明项目的数量并未减少,虽然投资的额度可能会受到宏观经济影响所致。 ◼中国AI企业A轮前融资频率的上升,在2023年受大型模型推动下的显著增长,反映了AI领域创业机会的增加和行业的持续热度 从中国人工智能企业的融资阶段分布观察,近年来A轮之前的早期融资事件频率呈上升态势,这映射出AI领域新兴创业机会与企业的不断涌现。在2023年,受大型模型技术的显著推动,A轮前融资活动频次出现显著增长,进一步彰显了人工智能行业的热度和投资吸引力的持续攀升。 中外大模型发展实践探析——国际大模型相关政策分析 •国际大模型政策总体方向聚焦于促进技术创新、确保安全与伦理性,以及加强监管合规。其中欧盟各国更加注重AI责任、伦理和道德的鉴定和发展,美国则更偏向于安全、隐私和技术的可持续性发展 中外大模型发展实践探析——中国大模型相关政策分析 •中国政策着重强调合法数据使用、知识产权保护和用户权益保障。与国际更开放协作且注重伦理的AI政策发展方向相比,中国在推动协作的同时,更注重自主性和可控性,特别是在关键技术和数据治理领域 中外大模型发展实践探析——中国与国际AI人才资源分析 •按国家来看,美国当前的AI人才数量遥遥领先于其他国家。中国当前的AI人才数量位居全球第二;其中中国的大学研究机构和互联网大厂是全球AI2,000人才榜单中中国顶尖AI人才的核心产出源 ◼2023年AI人才榜单显示,美国是全球AI人才的最大来源,中国紧随其后位列第二,而英国和德国分列第三和第四 在2023年的AI人才榜单中,美国以显著优势成为全球AI人才的最大汇集地,而中国紧随其后,成为第二大的AI人才来源国。根据2023年AI人才榜单的数据分析,美国在AI领域的人才储备上展现出压倒性的优势。超过1,100名AI人才来自美国,占全球