您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远? - 发现报告
当前位置:首页/行业研究/报告详情/

AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远?

文化传媒2023-03-18赵琳华西证券梦***
AGI(通用人工智能)专题之二:“文心一言”发布,国内厂商距离复现ChatGPT有多远?

请仔细阅读在本报告尾部的重要法律声明 [Table_Title] “文心一言”发布,国内厂商距离复现ChatGPT有多远? [Table_Title2] AGI(通用人工智能)专题之二 [Table_Summary] ► “文心一言”表现一如预期,不必过度悲观 3月16日“文心一言”发布,从官方demo来看,文心一言具备文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成能力,存在超预期亮点,但事前录屏降低了其演示的真实性,也并未对外直接开放,多因素导致公众反馈不佳。我们认为尽管上下文理解、语义逻辑、多轮对话方面尚有欠缺,“文心一言”展现了足够的文案创作能力,为B端降本增效的起始逻辑已经明晰,尽管尚未对公众大范围开放,企业用户已经能够申请内测邀请码,若邀请范围持续扩大,飞轮效应将推进“文心一言”表现改善,且优化空间极大。 ► 复现ChatGPT的难点在哪里?AI三要件略逊一筹,但差距并非不可逾越 1)算法上,去开源化极大增加了国内科技企业的复现难度,但学术界已有相对成功复现先例,随着人才流动、时间推移和研究进步,大模型性能很可能逐渐趋同。2)数据上,数据集质量、标注细节处理、用户真实交互是关键,尽管优质的中文标注数据集匮乏,使用英文数据进行预训练并不影响中文输出,科技企业能够参考GPT3的路径,利用海量用户交互提升数据质量。3)算力上,国内头部科技企业多已完成数据中心建设,能够实现算力资源部分自给,此外算力更接近于自由流通的商品,战略押注意愿明确、现金流充沛的国内厂商有希望弥合算力上的差距。 ► 工程化和应用分发能力是隐形壁垒,头部厂商优势明显 国产ChatGPT的落地在技术准备之外还需要两项核心要素:工程化与分发能力。1)工程化能力,即能够利用更低的成本和更高效的迭代做出先进的大模型应用,制作更高效、廉价、贴合市场的产品,能够同时容纳亿级用户在线。2)充沛的C端用户及B端应用场景,即更低的分发触达成本、更快速的产品应用迭代。国内厂商完全具备大DAU场景下AI工程化处理的潜力,且应用分发是国内企业的长项,头部厂商本身已经建起规模及心智壁垒,且商业模式无需再探索,如要落地AGI相关应用,获客成本远低于新进入者。 ► 若“文心一言”对外开放,增量成本仍可控 短期我们关注“文心一言”等产品对科技企业财务状况的影响,将增量成本拆分为训练成本、推理成本及数据标注成本(暂不考虑人力支出及维护费用),测算大模型落地搜索页面后年均增量成本约为16亿元。但考虑到国产模型参数量及数据集token数量均是未知,且Azure云计算价格与实际成本存在偏差,此外实际落地后各项成本均存在优化可能、具体会计处理方式还存在探讨空间,我们判断10-20亿元为其增量成本的合理范围(暂不考虑人力支出及维护费用),参 评级及分析师信息 [Table_IndustryRank] 行业评级: 推荐 [Table_Pic] 行业走势图 [Table_Author] 分析师:赵琳 邮箱:zhaolin@hx168.com.cn SAC NO:S1120520040003 -19%-13%-7%-2%4%10%2022/032022/062022/092022/122023/03传媒沪深300证券研究报告|行业深度研究报告 [Table_Date] 2023年03月17日 证券研究报告|行业深度研究报告 请仔细阅读在本报告尾部的重要法律声明 2 19626187/21/20190228 16:59 考百度2022年经营现金流净额261.7亿元,对公司正常经营影响可控。 投资建议 GPT4、Office365(Copilot)对公众的震撼只是前期技术突破后的余韵,而非AGI领域想象力的终点,产品的成功会驱动更多学术资源与产业投资的倾斜,人工智能必然成为产业发展长期主线,国产替代具有需求上的紧迫性。依然重点推荐百度(BIDU.US),判断“文心一言”表现符合预期,公司目前仍处于低估区间,尽管技术差距依然存在,短期内研发投入可能上行,我们看好人工智能领域投入对公司业绩及估值的长线提振。同时关注已在视频、营销、阅读等相关细分领域抢跑的重点标的,推荐当虹科技、捷成股份、蓝色光标、风语筑、浙文互联。 风险提示 “文心一言”落地效果不及预期风险;ToB服务推进节奏不及预期风险;成本大幅增长风险;AI产品道德及监管风险。 证券研究报告|行业深度研究报告 请仔细阅读在本报告尾部的重要法律声明 3 19626187/21/20190228 16:59 正文目录 1. “文心一言”答卷未知,但国产替代并不遥远 ................................................................................................................................4 1.1. 细究算法、数据、算力三要件,略逊一筹但仍有追平可能.....................................................................................................5 1.2. 工程化处理与分发能力是更高的壁垒.......................................................................................................................................... 10 1.3. 商业化路径已经明晰,搜索场景鲜明契合 ................................................................................................................................. 12 2. 若“文心一言”成功对公众开放,年化增量成本可控 ............................................................................................................... 15 2.1. 训练:前期固定投入较大,莱特定律驱动下成本必然下行 .................................................................................................... 15 2.2. 推理:与用户数量成正比,成本优化路径明确 .......................................................................................................................... 16 2.3. 数据标注:取决于人力价格,成本量级较低 ............................................................................................................................... 17 3. 投资建议.................................................................................................................................................................................................... 18 4. 风险提示.................................................................................................................................................................................................... 18 图表目录 图1 “文心一言”生成图片 .............................................................................................................................................................................4 图2 “文心一言”生成视频 .......................................................................................................................................................................4 图3 2005年起中国AI论文总数超美国..................................................................................................................................................5 图4 海外AI机构预测中国高引论文占比将超过美国 ........................................................................................................................5 图5 类ChatGPT产品的技术发展示意图.................................................................................................................................................5 图6 ChatGPT的技术突破点在于引入了RLHF(基于人类反馈的强化学习)............................................................................6 图7主流大模型数据集来源可分为六类..................................................................................................................................................8 图8 各类数据来源大小................................................................................................................................................................................8 图9 全球前十大科技企业数据中心容量排名...................................................................................................................

公众号
小程序
pwa
桌面端
kefu
联系客服
kefu
社群