AI智能总结
百花齐放,静待杀手级别应用 国联证券传媒互联网研究团队2024年2月27日 报告评级:强于大市 1、AI产业研究框架&海内外生态概览 基建层:AI硬件及云服务。以NVIDIA为首的AI硬件算力进步使大模型的单次训练成本降至可以接受的1000万美元以下;同时以Azure为首的云服务厂商集成了算力资源和AI建模的能力,也将成为基础设施的重要部分。 模型层:AI模型及算法。以OpenAI为首的研究机构连续发布了文本、图片等多模态生成的高质量模型,其中对话和图片产出内容质量之高使其短期内成为提高内容生产效率的工具,长期将引领下一代交互方式、成为新的流量入口。 中间件:MLOps等AIinfra。底层模型和上层应用之间的中间件,包括模型训练、模型推理两大板块中的各个细分环节,代表公司包括scaleAI、pinecone等。中期,随着上游大模型厂商“军备竞赛”,中间件作为“卖武器”的公司有望持续受益。 应用层:B端及C端AI应用。得益于上游分摊了大量研发成本,下游应用针对垂直应用场景定制小模型,满足特定的用户需求,实现商业化变现。目前从落地节奏来看,2B快于2C,工具类快于社交/内容类。 由于基建层、模型层竞争格局已较为稳定,硅谷投资人主要关注中间件、应用层的初创企业。 2、B端应用:从通用场景到垂直赛道 2. AI应用落地情况:B端渗透较快,C端静待Killer App 对产品体验要求较高,强调“易用性”:面向上亿级别C端用户的大众化应用,用户群体庞大且喜好各异,因此产品本身需要适配大多数用户的使用习惯,包括较低的学习成本、较快的响应速度、合适的使用场景等。强调“易用性”。 对产品体验的要求较低,强调“可用性”:面向企业端的定制化应用,客户群体规模较小且需求明确,因此帮助企业效率提升的重要性大于产品本身的使用体验。 1)海外:23年3-4月,意大利监管机构曾因ChatGPT内出现了用户对话数据和付款服务支付信息丢失的情况,且没有就收集处理用户信息进行告知,而禁止ChatGPT在国内的使用,验证问题解决后恢复。 海外:为防止数据泄露,23H1三星、台积电、软银、日立、日本瑞穗金融集团和摩根大通等企业相继开始限制ChatGPT等交互式人工智能服务在商业运作中的使用。亚马逊、微软和沃尔玛也已向员工发出警告,要求员工谨慎使用生成式AI服务,埃森哲则警告员工不要将客户信息暴露在ChatGPT中。 2)国内:根据网信办联合7部门发布的《生成式人工智能暂行管理办法》,对“提供具有舆论属性或者社会动员能力的生成式人工智能服务的”应用(即偏C端应用)的合规、备案提出了较高要求,对B端应用监管则相对宽松。 2.2 B端应用落地节奏:从通用场景到垂直赛道 怎么看B端应用发展前景:1)市场空间(下游行业是否足够大,客户付费意愿、能力是否强); AI作为生产力工具:在办公软件、平面设计等容错率高、工作流简单的通用性场景率先落地,正逐步渗透到游戏研发、医疗健康等垂直行业。分类来看: 2)产品能力(产品体验能否满足下游客户的需求);3)用户基数(用户基数大则形成网络效应,助力应用和下游客户共同成长)。 象限Ⅰ:专业程度高、工作流程复杂、数据壁垒高、容错率低。 壁垒最高:AI落地较难,一旦落地会形成较高的技术壁垒。 象限Ⅱ:下游用户需求涉及多模态内容生成、专业程度高、流程较为复杂;但行业偏娱乐属性、容错率高。壁垒较高:限于AI多模态能力,客户需求尚未被充分满足。 象限Ⅲ:办公、设计等通用场景,市场空间大,下游用户需求较为简单,主要为单一模态的内容生成(文本/图片)。壁垒较低:通用性SaaS,核心考验产品能力。 象限Ⅳ:行业数据以文本为主,任务多为文本调取/生成、相对简单;但场景专业度高、容错率相对较低。壁垒较高:包括行业数据、模型能力、深入客户工作流。 2.3 SaaS巨头保持优势,商业化加速落地 SaaS巨头凭借规模效应占据先发优势 AI渗透率持续提升,部分应用已开始提价 B端AI应用付费逻辑较顺,目前已有部分应用在付费的基础上实现提价。 巨头客群基数仍有优势:目前,AI并没有像移动互联网和云一样带来全新的用户群体和相应的获客渠道,因此拥有Go-To-Market优势的巨头仍具有先发优势; 其中微软365Copilot有望成为KillerApp:微软现有产品用户基数较大,有望 支 持Copilot功 能 快 速 普 及。23年11月,微 软 向 全 体 企 业 级 用 户 开 放Copilot。截至24Q1,40%《财富》百强企业已在使用Copilot。 大公司普遍积极布局:从巨头角度看,大部分公司已经历过PC、移动互联网和云三轮浪潮,因此大公司普遍重视、明确入场。 长期来看,随着头部AI应用普及提升B端客户产品认知,AI B端应用的ARPU值、渗透率提升均有望加速。 巨头们的主要策略: 1)借机重振产品品牌:AI既能落地带来价值,也是营销助手 如EinsteinGPT重新让Salesforce的爱因斯坦小人Logo获得关注,而此前Einstein作为Salesforce的AI品牌做的并不算成功; 微软Bing此前和Google相比在搜索体验和品牌度上均有较大差距,通过NewBing收获了潜在客户的关注度。 2)扩TAM保毛利: 微软、谷歌等少数在模型层深入布局的公司,在保毛利的同时做好了扩大CapEx投入的准备。 而大部分B端企业经营策略:试图在扩大潜在市场的同时维持毛利水平,主要通过新增客户付费点,或升级付费plan的形式落地。 如Bing Chat企业版、ZoomAI功能、PhotoshopAI都与其已有付费服务进行捆绑销售。 资料来源:微软,Notion,Salesforce,海外独角兽,新浪科技,IT之家,国联证券研究所整理 2.4创业公司仍有机遇:发掘垂类需求/颠覆式产品力 创业公司机遇1:发掘垂类行业需求 创业公司机遇2:颠覆式产品力 即使在较为通用的场景下,AI驱动的颠覆式产品力提升也为创业公司提供机会。 通用性场景几乎已被巨头占据,但仍有垂类场景下的B端客户需求仍未被满足。 例:Typeface:AI营销平台,可针对企业需求实现定制化内容生成 例:Harvey:OpenAI投资的法律领域Copilot,提升律所生产效率 Adobe前CTO创立的AI营销平台,估值10亿+美元 23年4月至年底收入增长十倍,已和多家顶级律所合作 行业空间较大;营销是企业的刚需。据Gartner,22年公司营销预算占收入比例约为9.5%。据Content Marketing Institute,23年内容营销占总营销费用比例约为10-49%。 行业空间较大:据Mordor Intelligence,2023年全球法律服务市场规模7525亿美元。 相对蓝海的竞争格局:传统法律行业SaaS局限于电子签名、合同管理两个环节,相关企业包括Docusign、CSDisco等,但帮助律师起草合同、为法官提供判决建议等的效率提升类需求仍未被满足。 竞争格局相对红海:据Statista,22年全球内容营销行业收入已达630亿美元。其中包括奥美、阳狮等传统营销团队,Canva、Figma等生产力工具,以及Midjourney等通用性AI文生图工具。 Harvey产品功能:类似法律行业Chatbot,能力包括法律文书写作、回答复杂的法律问题、合同文件的处理,以及定制公司特有的模型等。 Typeface产品功能:第一步导入企业数据以训练特定的AI模型,第二步用户按照模板或自定义生成营销内容。 Harvey公司亮点:1)大模型训练能力:Harvey在22H2就获得了GPT4的优先使用权,在此基础上用大量法律专业数据进行finetune; 相较于竞争对手,Typeface的优势在于: 1)相较于传统营销团队:降本增效,且避免数据泄露的风险;2)相较于传统营销SaaS:灵活程度高、使用门槛低、实现效果更丰富;3)相较于通用性AI工具:AI模型可以按照企业风格定制化。 2)行业专业数据库:与Allen&Overy等头部律师事务所、普华永道等头部审计公司绑定合作,以获取大客户资源、以及优质训练数据; 3)深入了解行业工作流程:公司CEO曾是DeepMind科学家,联合创始人则有著名律所的职业背景,使得团队既拥有丰富的法律实践经验,又深入了解大模型的能力、知道如何训练模型。 Typeface公司亮点:公司创始人为Adobe前CTO,懂技术的同时能够精准洞察行业需求; 风险:汤森路透等老牌法律巨头收购AI公司Casetext,普华永道也在打造自己的LLM工具,巨头的陆续进入可能影响竞争格局。 风险:目前功能仍较简单,在多模态生成层面优势不大。 资料来源:阿尔法公社,海外独角兽,Mordor Intelligence,国联证券研究所整理 3、C端应用:头部格局稳定,静待杀手级应用 3.3 AI C端应用落地节奏:工具先行,社交社区出现雏形,内容仍待孵化 工具类应用先行: AI重塑的点:交互方式改变、性能提升;AI从文本对话、图像生成两个维度,对传统应用进行重塑,也催生了一批新的应用,以chatbot类搜索问答工具、以及图像生成类工具为主。 社交社区类应用初现雏形:AI重塑的点:从人-人到人-机器; 相较于人,AI情感陪伴的差异化在于:可塑性更高、能够即使响应、具有时间厚度。头部应用Character.ai推出首月下载量超过ChatGPT。展望未来: AI与内容的结合仍有待探索: •类比移动互联网生态演进历程,正如2014年4G普及后才迎来移动互联网生态的繁荣,偏重度AI应用的发展也需依赖基础设施的进一步完善。•AI底层模型技术的持续迭代、以及算力等基础设施的进一步普惠化,或是AI应用繁荣的潜在前提条件。 AI重塑的点:生产效率、内容质量提升;目前尝试结合的场景:互动式阅读、游戏(交互性较强,或能发挥LLM的优势);多个影视、游戏大厂开始尝试AI与内容的结合,但仍需等待研发周期。 2022年后 4、2024年,还有哪些值得期待? 4.1应用层面,重点关注AI Agent OpenAI关注的新方向:AI Agent GPTs / GPTs Store:加速Agent生态落地 2023年6月,Lilian Weng(Open AI安全系统负责人&前应用研究负责人)在博客中发布新文章《大模型驱动的自主代理(LLM PoweredAutonomousAgents)》。 GPTs:相当于AI Agent的iOS开发系统。2023年11月,OpenAI首次开发者大会推出GPTs,每个用户可个性化定制不同功能的GPT。 GPTsStore:相当于AI Agent的AppStore应用商店。2024年1月,OpenAI正式推出GPTStore,首批上线的GPTs超过300万个。 4.2模型层面,重点关注Sora、GPT-5 Sora:视频生成模型的“GPT-3”时刻 GPT-5:更强的通用大模型,向AGI更进一步 •2024年1月,OpenAI首席执行官Sam Altman在达沃斯论坛接受媒体采访时表示,他现在的首要任务就是推出下一代大模型,这款模型可能被称为GPT-5,与现有模型相比,GPT-5“能做更多、更多的事情”。 •2024年2月,OpenAI发布视频生成模型Sora,演示效果相较于此前的文生视频应用Runway、Pika等大幅提升: 1)生成视频时长从几秒钟提升至60s,支持多镜头分镜; 目标:向AGI(通用人工智能)更进一步 2)可识别文字、图像、视频等多种prompt,复杂度、精准度提升; 3)可模拟真实世界物理交互的效果,如猫咪“踩奶”、吃汉堡留下咬痕等。 具体来看,GPT-5的突破之处或在于:1)多模态:不仅支持文本输入,还支持语音、图像、代码和视频。 技术层面,有望统一视频生成模型的技术路径,类似于GP