您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:AIGC行业快评:GPT-4、文心一言陆续发布,场景落地逐步成为AIGC产业核心 - 发现报告
当前位置:首页/行业研究/报告详情/

AIGC行业快评:GPT-4、文心一言陆续发布,场景落地逐步成为AIGC产业核心

文化传媒2023-03-17夏妍、张衡国信证券喵***
AIGC行业快评:GPT-4、文心一言陆续发布,场景落地逐步成为AIGC产业核心

请务必阅读正文之后的免责声明及其项下所有内容证券研究报告|2023年03月17日超配1AIGC行业快评GPT-4、文心一言陆续发布,场景落地逐步成为AIGC产业核心行业研究·行业快评传媒投资评级:超配(维持评级)证券分析师:夏妍021-60933162xiayan2@guosen.com.cn执证编码:S0980520030003证券分析师:张衡021-60875160zhangheng2@guosen.com.cn执证编码:S0980517060002事项:1)3月16日下午2点,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。2)3月15日凌晨1点,OpenAI发布了期待已久的GPT-4。GPT-4相比以往版本的最大变化是跨模态、长内容的解决能力,同时GPT-4具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。国信传媒观点:1)GPT-4主要亮点在多模态和长内容解决能力,文心一言国产大模型终于问世,二者背后本质是生成式AI的确定性产业趋势,技术底座夯实之下,应用场景将迎来实质性变革;2)多家A股传媒上市公司宣布接入百度文心一言,具体来看,有望在虚拟人、文本生产、虚拟空间、交互对话、内容宣发、数字营销等场景开展探索布局;3)从单一模态到多模态,GPT-4有望真正带来内容端、平台端的重估。微软GTP4、谷歌PaLM-E类跨模态模型可以处理更复杂的任务,使得通用大模型逐渐成为可能。除此以外,我们看到了预训练大模型成本可控及轻量化运行的趋势,这使得“通用大模型”+“垂直小模型”有望落地至具体场景,基于此诞生的类“内容大脑”的操作系统,让AI时代的新物种成为可能。从生产力到商业化应用,基于科技及产业视角聚焦传媒互联网关键环节核心标的,建议关注:1)数据要素及IP角度推荐中文在线(文学IP及内容数据与平台)、掌阅科技(文学IP及内容数据与平台)、视觉中国(图片素材)、中国科传(科技文献资源)、浙数文化(数据要素及交易平台、云计算服务等)、人民网(数据确权及内容审核)、新华网(数据确权及AIGC算法平台)等标的;2)场景落地关注文学、音乐、数字人、营销服务、电商、视频、游戏等领域,推荐汤姆猫(人机对话游戏场景落地)、昆仑万维(算法工具、AIGC在浏览器、游戏、社交等场景落地)、蓝色光标(数字人&营销服务)、天娱数科(ChatGPT+数字人)、三人行(营销场景)、哔哩哔哩(UGC、PUGC内容平台)、芒果超媒(在线视频)、恺英网络(游戏开发及NPC对话等场景)、宝通科技(VR/AR场景)等标的。风险提示:国内内容监管问题无法接入ChatGPT;应用场景产品落地不及预期;预训练大模型成本高昂,企业需求端尚不明晰;国产大模型效果低于预期。评论:百度:“文心一言”正式发布,关注其应用生态接入进展3月16日下午2时百度在北京总部召开发布会,主题围绕新一代大预言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告2图1:百度发布会展示文心一言五个使用场景中的综合能力资料来源:百度文心一言发布会,国信证券经济研究所整理具体来看:1)文学创作:发布会上李彦宏通过与文心一言围绕《三体》的6轮连续对话展示了文心一言对事实性问题的检索回答能力、总结分析能力和推理能力。关于事实性问题回答的正确率方面,文心一言采用了知识增强和检索增强,通过5500亿实时数据训练,可以保证事实性的回答能够比较准确。2)商业文案创作:通过三轮连续问答,文心一言完成了为公司起名、生成Slogan和生成公司成立的新闻稿三项任务,展现大模型的理解能力、表达能力和创意创作能力。3)数理逻辑推算:可解决鸡兔同笼问题,在两轮鸡兔同笼问题中文心一言能够识别问题提得对不对,并展现解题推理步骤提供正确答案。4)中文理解:文心一言具备领先的对中文和中国文化的理解能力,可以解释“洛阳纸贵”的意思、其中的经济学原理,并用“洛阳纸贵”写了一首藏头诗。5)多模态生成:在四轮问题交互中,文心一言完成通过文字生成图片、回答相关问题、用方言生成音频和用这些内容生成视频的任务。当前除了视频生成功能由于计算成本较高暂未开放,其他功能已向文心一言的用户开放。图2:文心一言的界面图3:与文心一言围绕《三体》的提问资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济研究所整理 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告3图4:文心一言完成为公司起名任务图5:文心一言解决两轮鸡兔同笼问题资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济研究所整理图6:文心一言用“洛阳纸贵”作藏头诗图7:文心一言通过文字生成图片海报资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济研究所整理从技术栈上看,AI时代技术栈有四层,分别为芯片层、框架层模型层和应用层。文心一言、文心一格都是属于模型层,文心是百度模型的一个品牌。AI时代的应用譬如搜索、聊天和其他的应用会基于这些大模型来进行开发。文心一言定位为一个通用的基础模型,未来大模型或扩散拓展为“通用大模型”+“垂直小模型”,产生譬如能源模型、交通模型、媒体模型等“垂直小模型”实现场景落地。文心一言发布会提出三方面的机会:1)新型的云计算,云计算的商业模式由IaaS变为MaaS(ModelasaService),应用或建立在大模型上而不是云算力或云储存上;2)行业模型的调精,行业将其数据、理解和知识与大模型相结合产生中间层的行业大模型,通过各个行业的模型的精调实用性更强;3)应用开发,在大模型基础服务之上产生的具有文字生成、图像生成、音频生成,以及数字人等能力的现象级新应用和新产品。从2月7日百度官宣发布文心一言,至今已有650家企业宣布接入文心一言生态。图8:AI时代的四层技术栈图9:百度认为大模型的三大产业机会资料来源:百度文心一言发布会,国信证券经济研究所整理资料来源:百度文心一言发布会,国信证券经济研究所整理 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告4微软:多模态GPT-4来袭,AIGC的应用场景端有望真正打开3月15日凌晨1点,OpenAI发布了全网期待已久的GPT-4。GPT-4的最大变化是跨模态、长内容的解决能力。同时GPT-4具有更广泛的通识知识和问题解决能力,可以更有效的解决难题。图10:OpenAI发布跨模态大模型GPT-4资料来源:推特,国信证券经济研究所整理相比前一代GPT,GPT-4的优势体现在:1)更有创造力:GPT-4更具创造性和协作性,可以与用户一起生成、编辑和迭代创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。2)视觉输入:GPT-4可以接受图像作为输入并生成说明、分类和分析。GPT-4可以看图说话,并并分析图表。3)处理更长的上下文:GPT-4能够处理超过25,000个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。GPT-4的高级推理能力超越了ChatGPT,处理复杂任务时GPT-4更可靠、更有创造力,并能够处理比较微妙的指令。 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告5图11:GPT-4对文本交互的精准度和创造性进一步提升图12:GPT-4能够理解图片中的逻辑资料来源:OpenAI,国信证券经济研究所整理资料来源:OpenAI,国信证券经济研究所整理图13:GPT-4可处理复杂推理任务图14:OpenAI公布GPT-4可在考试中超过90%的人类资料来源:OpenAI,国信证券经济研究所整理资料来源:OpenAI,国信证券经济研究所整理基于GPT-4,OpenAI官方给了几款加入了GPT-4的产品应用,涉及教育、公益、金融等领域。1)Duolingo:一款语言学习类APP,Duolingo把GPT-4接入产品,进行角色扮演,让人工智能跟用户去对话,纠正语法错误,并且把这一功能融入产品的游戏化;2)BeMyEyes:一款为视力障碍人士提供的产品,大部分的盲人类产品都只能识别文字,现在可以借助GPT-4的图像识别分析来看世界;3)摩根士丹利:摩根士丹利的内容库包含数十万页的知识,涵盖投资策略、市场研究和评论以及分析师见解,借助GPT-4改变其财富管理人员查找相关信息的方式;4)可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界一流教育。该组织为所有年龄段的学生提供数以千计的数学、科学和人文课程宣布将使用GPT-4为Khanmigo提供支持,Khanmigo是一种人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手。 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告6图15:Duolingo接入GPT-4图16:BeMyEyes接入GPT-4资料来源:OpenAI,国信证券经济研究所整理资料来源:OpenAI,国信证券经济研究所整理图17:摩根士丹利接入GPT-4图18:可汗学院接入GPT-4资料来源:OpenAI,国信证券经济研究所整理资料来源:OpenAI,国信证券经济研究所整理大模型不断升级,海外到中国,生成式AI浪潮已来从中国本土化大模型来看,目前国内大模型处于投入期,除了互联网巨头,还有科研机构等三方不断投入预训练大模型。相对而言看,百度在AI领域的长期持续投入,1)ChatGPT仍有内容监管漏洞,接入国内自己的大模型更加自主可控;2)从微软当前动态来看,ChatGPT仍未对中国用户开放注册,同时微软宣称将允许其他公司依据ChatGPT创建定制版本的模型,但仍未宣布具体时间表及实现路径;3)从百度的技术路径上看,百度在AI方面布局早,预训练大模型技术积累深,拥有海量中文自然语言数据,从数据上或更贴合中文自然语言模型的应用落地。表1:国内预训练大模型梳理序号发布时间大模型发布机构参数量训练数据模态功能是否开源12021年4月PLUG阿里270亿高质量中文训练数据(1TB以上)文本自然语言理解(NLU)、文本生成开源22021年4月盘古-α华为2000亿40TB训练数据文本自然语言理解、文本生成- 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告732021年4月孟子澜舟科技10亿基于数百G级别涵盖互联网网页、社区、新闻、电子商务、金融等领域的高质量语料训练文本、图像自然语言理解、文本生成-42021年6月M6阿里1000亿超过1.9TB的图像和292GB的文本文本、图像文本生成图像、图文匹配、图像描述-52021年6月悟道2.0智源研究院1.75万亿-双语多模态大模型NLP理解、生成任务与文生图、图生文任务开源72021年7月ERNIE3.0(文心)百度2600亿-多模态大模型语言理解、语言生成、图文生成-2021年9月紫东太初中科院自动化所千亿-三模态大模型通过跨模态语义关联达成视觉、文本、语音三模态同意表达和高效协同开源82021年9月源1.0浪潮信息2457亿在海量中文互联网上收集整理了超过5000G的高质量中文训练数据集文本文本生成开源92022年4月混元腾讯万亿级别-跨模态大模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户-102022年5月CogVideo清华94亿-文本生成视频目前最大的通用领域文本到视频生成预训练模型开源112023年2月Moss复旦百亿级别-文本对话式大型语言模型-资料来源:机器之心、公司官网,国信证券经济研究所整理目前已有多家A股传媒上市公司宣布接入百度文心一言,具体来看,有望在虚拟人、文本生产、虚拟空间、交互对话、内容宣