您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:GPT模型走向平台化,「手转AI」大幕拉开 - 发现报告

GPT模型走向平台化,「手转AI」大幕拉开

文化传媒2023-03-26赵琳华西证券在***
AI智能总结
查看更多
GPT模型走向平台化,「手转AI」大幕拉开

► ChatGPT着手打造内部生态,“模型即平台”时代开启 2022年3月,OpenAI开始逐步开放内部插件,并允许第三方在GPT模型内创建插件。我们认为这实际上是划时代的举措: 1)开放内部插件的意义,可以理解为用插件拓展GPT模型自身能力的边界,为模型添加“眼睛和耳朵”。尽管GPT4的语言模型被微软称作“早期AGI”,但依然存在数据库时间滞后、知识幻觉(输出缺乏依据的内容)等LLM常见的问题。通过允许第三方插件的接入,大模型得以联网,用户可以在 2)一旦形成第三方插件生态,GPT模型将成为AI时代的操作系统本身,可类比移动互联网时代诞生的操作系统IOS及安卓。不同之处在于,GPT模型并不是依靠硬件终端变化来实现代际变革,而是依靠人工智能技术为用户提供的实际便利场景去完成用户习惯的迁移。如果说ChatGPT模型的伟大之处是开创性地发现了RLHF+transformer+精细标注数据这一菜谱,通过工程化落地让人们广泛地接触到AI(类比智能手机出 现),那么推出内生插件则是更有野心、也更能看到划时代和商业意义的一步:一个基于AI的全新系统生态近在眼前。 ►外部成熟应用将向AI平台迁移,开启“手转AI”浪潮 AI加持下,GPT内部插件带来的用户体验优于直接使用外部的原生应用,用户的使用场景得以迁移到GPT模型内部。目前插件商店内部的第一批应用主要由OpenAI邀请的第三方开发,包括电商、办公协作、旅游、在线餐厅预订平台、计算软件等。随着外部成熟应用的交互圈层扩大,GPT与用户日常生活将结合得更加紧密,参考移动互联网时代的端转手趋势,主流应用即将展开向AI平台的迁移,即迅速适应并布局GPT内的AI插件,探索AI加持下自身应用的新场景。这实际上是新技术与流量的互惠:成熟应用依赖GPT的AI技术提高用户体验,而GPT则借助这些应用吸引更多用户,网络效应进一步加强了这种相互促进的趋势,从而提升GPT平台的生态价值。 ►插件开发门槛大幅降低,行业格局可能重塑 AI技术的加持下,用户开发GPT插件几乎不需要技术门槛。开发者只需简单描述对API的需求,模型会完成代码编写、身份验证、数据处理等工作。这意味着UGC(用户生成内容)回潮,玩法、用户体验和差异化成为下一阶段的关键: 1)由于用户和开发者不必担心复杂的技术实现细节,每个人都可以根据自己的需求创建插件,活跃的社区氛围下用户粘性将提升,插件生态将更加繁荣。2)对于开发者而言,创意、 玩法、差异化体验、与实际场景的融合度等成为了决定自身插件能否取得先发优势的核心因素。我们认为未来文娱、电商、教育等多个行业格局可能重塑。 投资建议: 1)随着海外大模型率先平台化、生态化,国产大模型的复现需求变得紧迫。模型层受益标的包括百度、华为(产业链)、阿里、三六零等明确具备大模型落地意愿及能力的厂商,同时追踪腾讯等厂商的相关技术进展。 2)应用层:境外业务占主导、海外用户基础大、有实际应用场景的公司会尽快接入GPT生态,先发优势下,我们认为这类厂商的估值将直接受益于OpenAI的波浪式创新。此外,海外映射逻辑下,关注布局游戏、浏览搜索、电商、本地生活等业务,并已有AIGC相关技术实践的标的。 风险提示 国产大模型落地效果不及预期风险;AI产品道德及监管风险。 ChatGPT推出内部插件,开启“模型即平台”时代 2022年3月,OpenAI开始逐步开放内部插件,并允许第三方在GPT模型内创建插件。我们认为这实际上是划时代的举措: 1)ChatGPT开放内部插件的意义,可以理解为用插件拓展GPT模型自身能力的边界,为模型添加“眼睛和耳朵”。尽管GPT4的语言模型被微软称作“早期AGI”,但用户目前使用的基于GPT4的ChatGPT付费版依然只能进行文本的处理,且依然存在数据库时间滞后、知识幻觉(输出缺乏依据的内容)等LLM常见的问题。通过允许第三方插件的接入,大模型得以联网,用户可以在ChatGPT内部借助插件完成更多样的任务,如资料查找、数据分析、行程预定、发布社交内容等。 2)一旦形成第三方插件生态,GPT模型将成为AI时代的操作系统本身。我们可以将其视作围绕AI展开的操作系统或底层平台,类比移动互联网时代诞生的操作系统IOS及安卓。不同之处在于,GPT模型并不是依靠硬件终端变化来实现代际变革,而是依靠人工智能技术为用户提供的实际便利场景去完成用户习惯的迁移。因此,开放内部插件最大的意义在于,随着插件与日常生活应用的紧密结合,GPT模型将不再是少部分人(尽管日活已经突破一亿,ChatGPT并未对全部国家及地区开放,使用门槛相对较高)使用的对话模型,而是一个所有寻求使用AI帮助的用户都必须使用的操作系统,AI时代的“IOS”诞生。 不同于向外出售API接口,内部插件的使用场景仅在对话页面内,实际上将插件应用带来的流量圈存在了GPT平台内部。此前ChatGPT的变现模式集中于向外出售API接口或微调模型,是对外赋能开发者或者Office等成熟应用;插件系统推出之后,依靠GPT的技术支持,开发者能够以极低的技术成本编写插件,优质插件能够进一步激活用户基础、提升粘性,第三方(如已经成熟的外部应用expedia)插件更能进一步引流外部用户至GPT,生态系统已经基本形成。 演示页面中已经出现了插件商店,商业变现潜力极大。目前插件功能还只对申请队列中的开发者和付费用户开放,但我们认为随着功能逐步开放给普通用户,插件商店完全可以复刻现有应用商店模式,优质插件可以按月订阅或买断,外部成熟APP会迁移至GPT模型内部形成AI加持下的插件(如同移动互联网时代的“端转手”)。 我们认为 , 如果说ChatGPT模型的伟大之处是开创性地发现了RLHF+transformer+精细标注数据这一菜谱,通过工程化落地让人们广泛地接触到AI(类比智能手机出现),GPT4模型在多模态能力上推进了AGI领域的进展,那么推出内生插件则是更有野心、也更能看到划时代和商业意义的一步:一个基于AI的全新系统生态近在眼前。 1.1.开放三大基础插件,GPT4开始联网 尽管GPT4(的语言模型版本)已经被微软认为达到了早期AGI(通用人工智能)的阶段,模型表现依然受到一定限制。2022年3月对外发布的GPT-4在抽象、理解、视觉、编程、数学、医学、法律、理解人类动机和情感等领域表现出色,微软提出它可以被合理地视为AGI(通用人工智能)系统的早期版本。AGI意味着智能不仅限于特定领域或任务,而且涵盖了广泛的认知技能和能力。但它们仍然存在问题,如缺乏元认知、认知谬误和非理性、训练数据过时等。此外,GPT4在ChatGPT中唯一可以开箱即用的能力就是输出文本,但仍需要用户对提示词进行较多处理。 插件的引入可类比为帮助模型补上了“眼睛和耳朵”。2022年3月,OpenAI开始逐步开放插件,并为开发人员创建插件提供支持。插件不仅允许机器人浏览网页,还可以与特定网站进行交互。我们梳理OpenAI提供三个基础插件如下: 浏览插件:GPT联网,用户体验实现极大跃迁 浏览插件即GPT模型调用Bing搜索的API,从网络检索内容,以此为依据实时推理和输出文本。这意味着大语言模型能够从互联网上读取信息,此前一直被人诟病的封闭性、滞后性得到解决(GPT4的训练数据库停留在2021年)。海量的必应搜索结果扩大了可以讨论的内容范围,超越了训练数据集的时间限制,融入了当下的新鲜信息,这一定程度上缓解了大模型常见的“幻觉”问题:大模型常对自己不掌握的知识做出看似合理的荒谬解答。 不同于NewBing在搜索页面调用GPT4,浏览插件是在ChatGPT的对话场景内调用Bing搜索,实现了反客为主。以下图为例,在对GPT模型问出涉及最新资讯的问题时,通过调用浏览插件,大模型完成了流畅准确的归总和输出。 从官方示例来看,在进行奥斯卡相关提问时,ChatGPT检索了最新一届的奥斯卡奖信息,并在信息流中附加链接。若在此基础上要求GPT将奖项信息以诗歌方式呈现,并不会影响输出的真实性。 联网的语言模型此前已有WebGPT、GopherCite、BlenderBot2、LaMDA2等,但表现并不理想,我们判断主要系抓取网络内容进行输出会影响回答的质量。 浏览插件为此在来源可靠性、信息真实性以及防止检索有问题内容的「安全模式」方面做了大量工作,插件在一个独立的服务中运行,与基础设施的其余部分分开。 训练数据集的版权界限依然模糊,但抓取网站数据会事先征求网站许可,法律风险相比封闭训练更低。为了尊重内容创作者并遵守网络规范,ChatGPT浏览器插件的用户代理token是ChatGPT-User,并配置为尊重网站的robots.txt文件。若网站拒绝抓取,GPT不会将网站内容输出,而不是以任何自动方式抓取网络。OpenAI还发布了IP出口范围,并实施了限速措施以避免向网站发送过多流量。 1.1.2.代码解释器:GPT将成为开发平台 代码解释器插件能够帮助用户在ChatGPT界面中完成完整的开发工作。用户能够在GPT的帮助下通过描述需求,直接生成代码、运行代码、上传和下载从CSV数据到图像的文件,并评估输出。此前用户即使可以通过ChatGPT创建代码,也需要将其放入另一个环境中进行测试。在新插件的加持下,用户可以在ChatGPT中进行大量开发,而无需离开UI。 代码解释器展现了极强的多模态能力 ,极大降低了用户的开发门槛。根据OpenAI提供的信息,代码解释器能够解决定量和定性的数学问题、进行数据分析和可视化、在格式之间转换文件等。我们参考网络用户反馈,除了生成代码之外,代码解释器还可以分析输出,并将其用于另一个函数。这意味着用户可以将不同的代码段串在一起,获取一个代码的输出并将其提供给另一个。从现有尝试来看,用户通过简单易懂的语言描述自己的需求,GPT可以将其快速完成,目前已完成的任务包括音频及图像生成、画图、识别人脸、自建机器学习预测算法、绘制行星轨迹图、编写小游戏等。 数据插件:模型得以访问开源数据并输出分析 数据插件使ChatGPT能够访问开源数据库,并生成分析结果,目前已经向公众开放。用户能够用自然语言的方式表达需求,获取最相关的文档片段,例如文件、笔记、电子邮件或公共文档,并进行数据分析。用户可以自己选取向量数据库(如Milvus、Pinecone、Qdrant、Redis、Weaviate或Zilliz)来索引和搜索文档,添加到他们有权使用的检索插件中,插件在一个独立的服务中运行,与基础设施的其余部分分开,一定程度上规避了数据授权和隐私风险。 1.2.第三方插件:开启成熟应用向AI平台迁移的序幕 GPT提供的技术支持,让插件带来的用户体验优于直接使用外部的原生应用,用户的使用场景得以迁移到GPT模型内部。目前插件商店内部的第一批应用主要由OpenAI邀请的第三方开发,包括电商平台Shopify、办公协作软件Slack、旅游平台Expedia、生鲜电商Instacart、旅游搜索引擎服务商Kayak、在线餐厅预订平台OpenTable、自动化平台Zapier、计算软件Wolfram等。 参考官方示例,用户能够使用插件同时调用多个应用的功能,实时解决生活问题。在用户提问“周末在旧金山吃素食,请推荐餐厅、食谱、计算卡路里、 采购食材”后,GPT调用了餐厅推荐、数学计算、生鲜电商插件,在一段对话内完成了这些生活化任务。 随着外部成熟应用的交互圈层扩大,GPT与用户日常生活将结合得更加紧密,主流应用将开启“手转AI”时代。ChatGPT已经具备了平台雏形,AI插件商店是GPT系统内部的AppStore,传统应用可能需要重新考虑自身的核心价值和业务模式,将自己的服务无缝融入ChatGPT中,用户界面、后端架构以及商业模式均有可能发生改变。 参考移动互联网时代的端转手趋势,主流应用即将展开向AI平台的迁移,即迅速适应并布局GPT内的AI插件,探索AI加持下自身应用的新场景,以免被时代淘汰。端转手时代中,各类应用纷纷