您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华西证券]:计算机行业报告:ChatGPT,开启AI新纪元 - 发现报告

计算机行业报告:ChatGPT,开启AI新纪元

信息技术2023-02-03华西证券枕***
AI智能总结
查看更多
计算机行业报告:ChatGPT,开启AI新纪元

分析师:刘泽晶 SAC NO:S1120520020002 邮箱:liuzj1@hx168.com.cn 核心逻辑: ChatGPT,人工智能的旷世巨作。ChatGPT是一种聊天机器人软件,OpenAI于2022年11月推出的聊天机器人,具备人类语言交互外复杂的语言工作,包括自动文本生成、自动问答、自动摘要等多重功能,应用场景广阔,相较于上个版本更像人类一样聊天交流。OpenAI除了ChatGPT还包括Dall·E2、Whisper等项目分别是自动绘图、自然语言翻译等软件。OpenAI的商业模式即API接口收费,可根据不同项目需求进行收费,我们认为其商业模式属于底层模型开放性标准化SAAS服务模式。我国仍处于初期阶段,以辅助生成内容服务为主,我们认为未来有望形成相关SAAS模式。 ChatGPT促使AIGC快速商业化发展。GPT系列是AIGC的一种商业化方向,目前AIGC已经实现商业化的方向有AI写作、AI作图、AI底层建模,未来AI生成视频和动画领域有望快速商业化发展。AIGC也被认为是继UGC、PGC/UGC之后的新型内容生产方式,有望解决PGC/UGC创作质量参差不齐或是降低其有害性内容传播等问题,有望在实现创意激发,提升内容多样性的同时降本增效,并大规模使用。目前我国已经有商业化例如百度AIGC数字人主播度晓晓、百家号TTV等。 AIGC蓬勃发展,相关厂商有望受益。我们认为AIGC的出世会产生革命性的影响,同时有望赋能千行百业。我们认为受益厂商分为三类,分别是:1、AI处理器厂商,具备自研AI处理器的厂商可以为AIGC的神经网络提供算力支撑,AI处理器芯片可以支持深度神经网络的学习和加速计算,相比于GPU和CPU拥有成倍的性能提升和极低的耗电水平;2、AI商业算法商业落地的厂商,原因是AI算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势和技术领先性;3、AIGC相关技术储备的应用厂商,相关厂商有望在降本增效的同时实现创意激发、提升内容多样性并打开海量市场。 投资建议:关注三条投资主线1)具备自研AI处理器的厂商,受益标的为寒武纪、商汤、海光信息;2)具备AI算法商业落地的厂商,重点推荐科大讯飞,其他受益标的为:汉王科技、拓尔思、海天瑞声、虹软科技、云从科技、格灵深瞳;3)AIGC相关技术储备的应用厂商,受益标的为万兴科技、中文在线、阅文集团、昆仑万维、视觉中国。 风险提示:核心技术水平升级不及预期的风险、AI伦理风险、政策推进不及预期的风险、中美贸易摩擦升级的风险。 纪元,ChatGPT ,星星之火可以燎原 投资建议 风险提示 纪元, 1.1ChatGPT:AI的旷世巨作 ChatGPT是一种聊天机器人软件:全名为Chat Generative Pre-Trained Transformer,是OpenAI于2022年11月推出的聊天机器人,该软件使用方便快捷,只需向ChatGPT提出需求,即可实现文章创作、代码创作、回答问题等功能。 ChatGPT功能强大:ChatGPT目前仍以文字方式互动,而除了通过人类语言交互外,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。如:在自动文本生成方面,ChatGPT可以根据输入的文本自动生成类似的文本,在自动问答方面,ChatGPT可以根据输入的问题自动生成答案。还具有编写和调试计算机程序的能力。此外, ChatGPT有望一定程度上替代搜索引擎。 1.2ChatGPT:前景广阔,打开海量应用场景 ChatGPT关注度较高:截至于2022年12月4日,上线仅5天,OpenAI估计ChatGPT已经拥有超过100万用户。此外,根据《纽约时代》报道,GPT的下一个版本GPT-4有望于2023年某个时候推出。 ChatGPT打开海量应用场景:ChatGPT应用场景广泛,拥有潜在空前蓝海,其功能覆盖各个板块,我们将其分成生成应用和布局、搜索和数据分析、程序生成和分析、文本生成、内容创作、一般推理和其他七部分。 我们认为基于其庞大的算力和算法分析,领域有望覆盖教育、科研、游戏、新闻等多重板块并有望持续拓展,市场潜力较大。 1.3ChatGPT的前世今生 我们认为,ChatGPT经历了人工智能发展的三大趋势 机器学习:2012年左右,随着基础算力的提升,全球已经开启人工智能热潮即大数据时代。政策、资本先行,应用场景逐渐丰富。机器学习是AI的一种技术方向,无论是自然语言处理还是机器视觉都是机器学习的应用。 神经网络:2015年左右开始繁荣爆发,神经网络是实现AI深度学习的一种重要算法,是通过对人脑的基本单元神经元的建模和链接,探索模拟人脑系统功能的模型,并研发出的一种具有学习、联想、记忆和模式识别等具有智慧信息处理功能的人工系统。 Transformer算法:2017年左右,是图型神经网络的一种,Transformer开始广泛应用于机器翻译之中,逐步取代循环神经网络(RNN),不再使用递归,而是采用了注意力机制进行优化,通过自我监督学习或无监督方法进行训练,优点在于建模能力强,通用性强,可扩展性强,能够更好的进行运算。而ChatGPT则是在该算法上不断迭代、演进、升级最后生成的一种算法。 1.3ChatGPT的前世今生 从算法模式的版本上,ChatGPT已经经历了四个版本,未来有望生成新版本即GPT-4。 GPT-3是GPT系列第三代语言预测模型,是OpenAI创建的GPT-2的继任者:GPT-3的应用包括帮助Viable公司快速理解客户反馈、帮助 Fable Studio完成VR角色的虚拟人物生成,实现与自然人对话、帮助Algolia实现快速予以、论文搜索等(算法准确率高达91%,准确率是BERT算法四倍)。 我们认为,InstuctGPT可以理解成是GPT-3的微调版本:InstructGPT由GPT-3语言模型提供支持,是一种对齐语言模型以遵循指令,InstuctGPT模型比GPT-3更擅长遵循指令,且回答更真实,且有害情绪输出大幅下降例如暴力情节。 1.3ChatGPT的前世今生 我们认为,ChatGPT可以理解成是GPT-3.5的微调版本:ChatGPT是从GPT-3.5系列中的一个模型进行微调,相较于InstructGPT, ChatGPT效果更加真实(拥有非常强的泛化能力和生成能力),模型的无害性实现些许提升(生成带有有害、歧视、偏见等情况的有问题样本的概率本身就会很低),编码能力更强(在GPT3.0积累的大量Coding代码基础上,部分OpenAI内部员工参与了数据采集工作)。 GPT-4有望打开海量应用:OpenAI首席执行官称,GPT-4有望成为多模态的人工智能,根据openAI创始人Altman消息,参数预计更大,计算模型优化有望实现更优化,且GPT-4将是纯文本模型(不是多模态),我们认为GPT-4的推出潜在商业价值巨大,模型更具备“拟人化”的功能,文本生成和内容创作有望更加丰富,并有望进入文字工作的相关领域,例如新闻、金融等相关行业。 1.4 CHATGPT的一小步,AI的一大步 ChatGPT与InstructGPT的相同点:使用来自人类反馈的强化学习(RLHF)来训练该模型。 ChatGPT与InstructGPT的不同点:数据收集设置略有不同、并加入了强化学习近端策略优化,可以理解成在“人脑思维”的基础上加入了“人类反馈系统”,是一种奖励模型。因此效果更佳真实、模型的无害性实现些许提升,编码能力更强。 1.5ChatGPT仍有提升空间 ChatGPT仍有提升空间,仍有一些限制需要突破: 可能写出看似合理但不正确或荒谬的答案,原因是:1、训练时没有真实来源;2、训练模型谨慎性的提高导致它拒绝可以正确回答的问题;3、监督训练会误导模型; 对输入措辞的调整或多次尝试相同的提示很敏感。例如,给定一个问题的措辞,模型可以声称不知道答案,但只要稍作改写,就可以正确回答; 该模型通常过于冗长并过度使用某些短语; 该模型已努力使模型拒绝不当请求,但它有时会响应有害指令或表现出有偏见的行为。 1.6ChatGPT的背后:强大的AI公司OpenAI 全球AI的“领军企业”OpenAI:OpenAI是美国一个人工智能研究实验室,是促进和发展友好的人工智能,使人类整体受益。OpenAI成立于2015年底,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。此外根据新浪消息,埃隆·马斯克为公司的创始人,但于2018年提出离职,原因是特斯拉与AI的关联越来越深,外界担忧特斯拉将运用OpenAI的技术实现升级。 根据Insider消息,ChatGPT于2022年11月发布后,OpenAI估值已涨至290亿美元;此外根据新浪科技消息,OpenAI最近告诉投资者,预计2023年营收将会达到2亿美元,2024年将达到10亿美元。 OpenAI不仅仅是ChatGPT:Open AI的业务不仅仅局限于ChatGPT领域,还包括Dall·E2、Whisper等项目。DALL·E2可根据自然语言的描述创作逼真的绘画作品,Whisper是一种语言识别系统,其鲁棒性和准确性极高,支持多种语言的转录并翻译成英文。 1.7OpenAI的商业模式 OpenAI的商业模式即API接口收费:客户可以通过OpenAI的强大AI模型构建应用程序,例如访问执行各种自然语言任务的GPT-3、将自然语言翻译成代码的Codex以及创建和编辑原始图像的DALL·E。公司按照不同项目的AI模式和不同需求进行收费,对于AI图像系统按不同的图片分辨率定价;对于AI语言文字系统按字符单价收费,对于调整模型和嵌入模型按照文字单价收费,并根据不同的调用模型区别定价。目前DALL·E方面,已有超过300万人在使用,每天生成超过400万张图像。其API具备快速、灵活、可拓展等性质。 我们认为OpenAI的商业模式属于底层模型开放性标准化SAAS服务模式:公司通过提供相关AIGC代码,提供自动图形模型或语言模型生成等产品,用户通过其API接口接入,并支付平台费用获取相关图像、语言、代码调整服务,OpenAI可获得付费订阅式的SAAS费用,我们认为该商业模式用户粘性极强。目前我国AIGC商业仍处于初期阶段,部分文本、图像等生成的公司仍处于初期阶段,以辅助生成内容服务为主,部分公司已经进入AIGC开发阶段,但仍处于免费试用、获取流量阶段,我们认为未来相关公司SAAS模式有望形成。 2.1 ChatGPT促使AIGC快速商业化发展 AIGC的含义:AIGC(AI Generated Content)即人工智能自动生成内容可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势,打造新的数字内容生成与交互形态。我们认为,GPT系列是AIGC的一种商业化方向。 AIGC已经实现的商业化方向: AI写作:例如AI生成文字、写邮件、广告营销等,比如GPT的使用,我们认为其应用场景有望提高文字工作者的效率,例如新闻、政府、金融等工作场景。 AI作图:AI自动生成图片,只需要简单输入几个关键词即可在几秒钟之内诞生一幅画作,我们认为可将其应用于传媒、游戏、宣传等工作场景。 AI底层建模:AIGC生成底层技术开发,OpenAI和StableAI是该方向的龙头,我们认为其工作场景有望提高算法工程师的效率,并进入互联网、ICT等广泛应用场景。 AIGC未来商业化发展方向: AI生成视频和动画,目前该领域仍存在连贯性和逻辑性的问题亟待解决。 2.2 AIGC有望打开海量空间 AIGC也被认为是继UGC、PGC/UGC之后的新型内容生产方式:UGC是用户生成内容,起源于Web2.0时代,例如博客、视频分享、Youtube等应用方案;PGC/UGC分别指专业生产内容与职业生成内容,例如视频创收平台优酷、土豆平台节目《暴走漫画》、《万万没想到》、或是抖音、快手等用户生产内容