您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[上海证券]:传媒行业GPT系列专题之三:GPT聚焦全领域发展,应用篇 - 发现报告
当前位置:首页/行业研究/报告详情/

传媒行业GPT系列专题之三:GPT聚焦全领域发展,应用篇

文化传媒2023-04-20上海证券℡***
传媒行业GPT系列专题之三:GPT聚焦全领域发展,应用篇

证券研究报告2023年4月20日行业:传媒增持 (维持)GPT聚焦全领域发展:应用篇——GPT系列专题之三 分析师:陈旻 SAC编号:S0870522020001 2主要观点我们将“AI+传媒”的研究框架体系定义为“通用大模型”+“行业小样本”的技术架构,“AI+传媒”在应用层表现效力优劣的关键取决于通用大模型对垂直应用的适配程度及迭代速度,1、适配程度是指:多模态的输入及输出是否匹配应用层的输入及输出。比如GPT-4属于“图+文”多模态输入+“文”单模态输出,因此输入模态为“图或文”且输出模态为“文”的垂直应用更适配GPT-4。2、迭代速度是指:应用层产生的“行业小样本”的数据量是否匹配大模型的迭代要求。根据我们对GPT模型的理解,比如Bing AI产生的“行业小样本”源自Bing的搜索结果,ChatGPT产生的“行业小样本”源自用户的反馈和互动。因此我们认为,对于超出GPT所使用的预训练数据库范围(2021年9月前)的事实性表述,Bing AI反馈的是搜索的结果,ChatGPT反馈的是用户主动的观点,Bing AI反馈的效果比ChatGPT更好。我们认为“行业小样本”的价值取决于数据数量及数据质量,数量大且质量高(多模态)的应用场景复用及迭代AI能力的效力更强,因此更进一步理解我们的研究框架,我们将“行业小样本”的结构分层(中层小模型+下层应用及内容),并将“行业小样本”的结合方式分类(调用+训练):1、“行业小样本”的数据集来自小模型或应用及内容:AI产业链包括上层大模型、中层小模型、下层应用及内容,包括应用及内容直接接入大模型或通过小模型接入大模型两种方式,即“大模型+应用及内容”或“大模型+小模型+应用或内容”,其中具备特定功能的AIGC软件产品及MaaS我们理解为“小模型”+“应用”的技术范式,本身具备较高质量的AI能力,若接入匹配的多模态大模型,有望实现能力上的质变突破。 dVeWeW8YdVdVfX9UcZaQbPbRnPmMoMoNiNqQtPjMsQoP8OoOxOvPtRrOwMrQsO3主要观点2、“行业小样本”的结合方式包括“能力调用”及“能力训练”两类:(1)“能力调用”是指下游垂类场景直接调用通用大模型的通用能力,并基于垂类场景内产生的特性化数据不断提升调用能力在垂类场景内的适配程度。我们认为现阶段下游应用及内容主要采取此类方式接入大模型能力,此类方式可高效快速调用大模型先进能力,在时间上及成本上具备优势。我们认为“能力调用”匹配“AI+传媒”的第一层利好,即通过AI降本增效,大幅提高数据及内容的供给量。内容产业本质由供给决定需求,因此内容供给量的明显提升将有效带动传媒基本面拐点及增量空间出现。(2)“能力训练”是指下游垂类场景将通用大模型针对特性化数据集进行再训练,从而形成垂类场景专属大模型。例如彭博社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。我们认为“能力训练”匹配“AI+传媒”的第二层利好,即下游垂类场景本身的数据或内容反过来“再训练”通用大模型(或开源大模型),形成传媒内容场景专属大模型,形成更稳定且高质的内容输出。我们认为训练难度文本<图片<视频<影视<游戏,且内容数量逐步递减但内容质量逐步递增,即偏后端的影视、游戏在内容数量上训练量级不足,因此高质量的内容形态首先通过“能力调用”输出AIGC内容,再将AIGC内容“再训练”大模型以解决高质量内容数量不足的问题(合成数据“再训练”范畴)。 4主要观点从投资的角度,按照我们的研究框架,传媒对应垂类场景的“行业小样本”,其核心价值取决于数据与内容,第一层对应数据与内容的输入模态是否匹配大模型的输出模态;第二层对应数据与内容的数量及质量是否匹配大模型的能力再训练:1、按照“模态匹配”的逻辑,AI+文本/虚拟人预计率先兑现案例及业绩,其次AI+图片可通过“大模型”+“小模型”组合方式实现(如GPT+Stable Diffusion、GPT+Midjourney)。随着未来GPT-5提供更多模态的输入及输出,下游垂类场景的适配范围有望扩大,通过“能力调用”适配的应用及内容场景更为丰富,因此后续“AI+视频/影视/游戏”的案例兑现度存在新的催化空间。OpenAI最新发布的GPT-4核心特征包括:(1)多模态输入(图+文),单模态输出(文),可以阅读并总结论文内容、解答较高难度的物理题目、具备较强的OCR能力(如识别网页草稿并按要求反馈网页代码)、理解人类社会常识;(2)具备长文字处理及推理判断能力,GPT-4上下文上限约2.5万字,允许使用长格式内容创建、扩展对话以及文档搜索和分析等,能够阅读并记忆更多信息,且具备更高的推理判断能力;(3)可靠性大幅提升,分辨能力提高,有效减少“虚构”或“有害”信息输出。2、按照“能力再训练”的逻辑,AI+内容/IP预计空间及价值更大,其价值核心取决于数据与内容/IP的数量及质量的高低。微软本周发布的DeepSpeed-Chat大幅提升大模型预训练速度并大幅降低训练成本,我们认为最核心意义为大幅降低垂类场景专属大模型的训练门槛,小模型层及应用层有望明显受益。掌握数据及优质内容(多模态数据)的下游场景具备核心竞争力,因此内容及IP(版权)的价值有望重估。DeepSpeed-Chat集成预训练语言大模型完整三个步骤,其中针对第三步RLHF训练集成了高效且经济的DeepSpeed-RLHF系统,使复杂的RLHF训练变得快速、经济并且易于大规模推广(相比现有系统提速15倍以上,且大幅降低算力要求及成本)。风险提示:宏观经济风险,地缘政治风险;技术发展不及预期;AIGC行业发展不及预期。 5主要内容本篇报告主要介绍了以下方面:1)OpenAI通过大量数据来训练AI系统并执行任务,应用于多个领域,改善人们生活。2)持续深化AI赋能,加速探索全方面、多领域的商业化路径。3)不断改善GPT数据驱动模型性能,完善下游市场,引领软件、硬件、芯片的全面发展。uOpenAI使用深度学习技术构建生成模型,多领域运用到人们生活。GPT-4的大型多模态模型通过使用大量数据来训练AI系统并使其执行任务,应用于多个领域。通过多家公司和多种程序应用在GPT-4模型上的建立、探索和贡献,将GPT-4打造成为改善人们生活的宝贵工具。u深化与人工智能合作,借力提升工作效率、加速产品创新、延续文化发展。各公司持续深耕AIGC领域,加大产品布局,目前已运用到教育、搜索、游戏、电商、社交媒体、营销、娱乐、医疗、政府、办公等领域。u不断改善模型性能和AI技术,完善下游市场,引领软件、硬件、芯片的全面创新。AI技术的发展加速AI算力的提升,需要软件服务、硬件支撑、芯片技术等方面协同创新。uGPT技术将成为国内外科技巨头必争之地。CHATGPT发布后,国内多家科技巨头企业逐步跟进,中国企业进入AIGC赛道。随着数据的增多,GPT的数据驱动模型性能也会逐步提高,因此会吸引更多的用户产生更多的数据,从而形成良性循环,不断改善模型性能、完善下游市场。 SECTION一、背景介绍:构建应用多领域的模型二、赋能领域 :全方位、多公司、多程序应用三、未来展望:完善下游市场,形成良性循环四、投资建议五、风险提示目录Content 71.1 聚焦多领域应用OpenAI使用深度学习技术构建生成模型。该技术通过使用大量数据来训练AI系统并使其执行任务,可以应用于多个领域。u文本处理方面,作为一个高级的文本模型语言处理工具,可以生成、分类、汇总高度连贯和准确的文本,通过训练语言模型来理解并遵循用户意图。ChatGPT可以用于文本分析、生成、翻译、自动摘要等自然语言处理。u图像方面,形成了以CLIP(匹配文本和图像)和DALL-E(从文本描述中创建原始、逼真的图像和艺术)为代表的图像生成模型。u语音方面,将AI运用到音频处理和音频生成中,促进语言识别和原创音乐的发展。图1 文本处理领域资料来源: OpenAI官网,上海证券研究所通过训练模型来总结整本书和读者反馈图2 图像领域资料来源: OpenAI官网,上海证券研究所CLIP:连接文本和图像图3 语音领域资料来源: OpenAI官网,上海证券研究所生成各种流派和艺术家风格的原始音频使用 4 种不同的乐器生成 10 分钟的音乐作品DALL-E:输入一位宇航员以逼真的风格骑马 81.2 GPT-4使用方法OpenAI致力于通过多家公司和多种程序应用的努力,在GPT-4模型上建立、探索和贡献,将GPT-4打造成为改善人们生活的宝贵工具。1)ChatGPT Plus客户端:第一步,打开GPT-4官网,进入CHATGPT PLUS;第二步,登录OPENAI/CHATGPT账户,升级成Plus用户与GPT-3.5模型下的ChatGPT不同的是,ChatGPT Plus取消免费会员资格,每月需支付20美元订阅费。图4 ChatGPT Plus 使用指南 (openai.com)资料来源: OpenAI官网,上海证券研究所2)API端,公司邀请更多开发者,逐步扩大规模与需求。第一步,打开GPT-4官网,进入Join API waitlist申请注册候补名单;第二步,获得访问权限后,可以向 GPT-4 模型发出纯文本请求,定价0.03美元/1k prompt token,0.06美元/1k completion token。图5 API开发者使用指南 (openai.com)资料来源: OpenAI官网,上海证券研究所 92.1 赋能领域——教育(1/2)GPT-4深化语言学习软件Duolingo的对话功能,打造Duolingo Max协助语言教育产品。Duolingo Max是在Super Duolingo的基础上,通过“角色扮演”和“解释答案”两大全新功能推出的新产品,协助语言教育。 uDuolingo每月有超5000万学习第二语言的用户,支持40余种语言,拥有100余门课,用户通过使用手机便可进行简单的词汇学习、复杂的句子结构学习和语法学习。u与母语人士对话可快速提升语言学习,但此办法成本高、实行难度大,因此Duolingo使用GPT-4运行“Roleplay”(角色扮演)的个性化课程和英语测试,来减少学生与母语人士对话的难度,并通过“Explain My Answer”(解释答案)来反馈学生对话练习时的错误表述,加深课堂对话时的回答,解释学生练习时答案正确或错误的原因,并提供示例进一步解释答案。图6 Duolingo用户界面资料来源: OpenAI官网,上海证券研究所 102.1 赋能领域——教育(2/2)可汗学院使用GPT-4创建聊天机器人AI助手Khanmigo,免费提供给可汗学院的学生和教师,开辟AI教育的新领域。u可汗学院是一家为任何地方的任何人提供免费世界一流教育的非营利组织,为各年龄段的学生提供上千节数学、科学和人文课程。可汗学院2022年开始测试最新版本OpenAI语言模型,2023年3月14日宣布使用GPT-4驱动AI助手Khanmigo,Khanmigo既可以作为学生的虚拟导师,也可以作为教师的课堂助教。uGPT-4能够理解用户的问题和提示。学生端:与学生来回对话并提出个性化问题,促使学生更深入的学习。教师端:为教师编写教学材料,未来帮助教师为学生量身定制学习计划、帮助教师了解每位学生在可汗学院的表现。图7 Khanmigo帮助学生解答数学问题资料来源: OpenAI官网,上海证券研究所图8 Khanmigo帮助教师提供教学材料资料来源: OpenAI官网,上海证券研究所 112.2 赋能领域——搜索引擎Microsoft Bing与OpenAI共同打造New Bing,提供自然语言处理服务和解决方案。u随着GPT-4的发布,微软与OpenAI的合作也让New Bing成功接入GPT-4模型,让用户在Bing.com浏览器中体验强大的搜索、回答、聊天和创意功能。New Bing像是Web搜索的研究助理、个人规划师和创