您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:AIGC与数据要素的思考 - 发现报告
当前位置:首页/行业研究/报告详情/

AIGC与数据要素的思考

信息技术2023-02-12宋嘉吉国盛证券足***
AIGC与数据要素的思考

请仔细阅读本报告末页声明 证券研究报告 | 行业点评 2023年02月12日 区块链 AIGC与数据要素的思考 近期随着微软将ChatGPT嵌入搜索引擎,AIGC继续成为市场焦点。市场此前认为AIGC可能是一个类似于元宇宙的主题,但当看到产品和商业模式的陆续落地,慢慢地感受到AIGC将为技术、产业产生更为深远的影响。上周我们从CPO算力的角度寻找AI算力下光器件技术的预期差,本周聚焦AIGC与数据要素。 1、ChatGPT的胜利,LLM的正名之战 从技术发展上看,此前的AI较多聚焦于知识图谱、深度学习。知识图谱是一种结构化的语义库,就是把面向特定行业、特定场景的各类知识按照特定的关系进行呈现。而手动完成知识图谱过于费事费力,便引入了深度学习,然而近年来进展却仍较缓慢。而ChatGPT背后的LLM(大型语言模型,Large Language Model)却将所有任务统一到生成环节下,即通过海量数据的训练,获得对后续内容(Token)的预测。根据我们和产业界的交流,其实这种算法一直都有,但让大家惊讶的是OpenAI通过如此长时间的投入、积累、训练,将LLM用得炉火纯青、独辟蹊径。就像金庸小说中很多武林高手虽身怀多个绝技却无法登上华山之巅,而郭靖却凭借降龙十八掌多年苦练而一战成名。2020年,GPT3.0的出现也标志着LLM推动行业进入通用人工智能时代,真正的AIGC时代逐步拉开序幕。 2、数据要素——不仅是交易,更要使用 2020年起,我国逐步明确将数据作为资本、劳动、技术以外的新型生产要素,2022年更是在政策中频频提及,并快速推进成立数据交易市场。其实从2015起,当大数据概念兴起之时,国内就陆续出现过地方性数据交易平台,但因为数据隐私保护的立法、技术平台不完善,数据交易并未兴起,而今随着政策完善,数据要素价值将被进一步挖掘。但我们认为,交易只是第一步,如何使用数据才是根本。数据是一种特殊的资产,当A有一本书、B有一本书,如果两者交换借阅,那么A和B各读了两本书,这是“1+1=2”的线性关系,但当A或B将书中的知识融会贯通后,其输出往往是“1+1>2”的,那如果是10本书、100本书呢?这种价值类似于LLM模型进行海量数据训练后形成的“通识化底座”,对接各个行业后能快速形成应用,是对数据要素价值的完美呈现和商业变现,一定程度上也消除了数据孤岛问题,毕竟人工对接数据需求效率太低,只有依靠机器进行训练才能快速迭代当下海量数据并承载应用。所有合规数据的掌握者都应成为这个“AI底座”的数据投喂者和使用者。 3、AIGC+数据要素,未来信息安全的制高点 ChatGPT的兴起让全世界看到AI技术不再高冷,每个人都可以提出问题、输入数据或范例和ChatGPT互动,本质上这为ChatGPT的训练提供了海量的人工反馈,相信在下一代GPT-4中将更好地展示这一效果。从2022年开始,我们与大量业内团队交流,其焦点仍在模型与训练。即便像Stable Diffusion开源,但基于此模型产品的数据集和训练方法并不开源,类似于告诉大家红烧肉的图片,但没有烹饪过程细节,美味依然难以复现。而随着OpenAI产品、商业模型日渐完善,其飞轮效应将逐步显现,全球龙头地位将更加明显。融合了AI的通用性和海量数据训练能力,微软New Bing的推出重新定义了搜索引擎,ChatGPT联网后也会接触到更多信息,抢占信息安全的制高点。作为一种数字化的创新,且迭代速度远快于传统产业,发令枪已响,预计2023年国内外各科技大厂将陆续推出AIGC领域的产品,竞争 增持(维持) 行业走势 作者 分析师 宋嘉吉 执业证书编号:S0680519010002 邮箱:songjiaji@gszq.com 相关研究 1、《通信:CPO/硅光/薄膜铌酸锂,AIGC背后高算力下的创新》2023-02-10 2、《区块链:AIGC的思考—不只是技术》2023-02-06 3、《通信:运营商引领数字化,BOSS助力数据要素变现》2023-02-06 -32%-16%0%16%2022-022022-062022-102023-02通信沪深300 2023年02月12日 P.2 请仔细阅读本报告末页声明 态势值得观察。 4、伦理与监管,AIGC的新焦点 2022年11月份,我们就AIGC的法律合规问题与专业律师进行过讨论,一个简单的例子:通过DALL-E2、Midjourney生成的图片,其版权是属于“Prompt提出者”、“AIGC平台提供方”还是“训练数据提供方”?目前欧美就此问题争论颇多,版权、就业等都是焦点,目前尚未有定论。此外,在数据收集、训练中涉及到的歧视、偏见也引发了社会关注,此方向的论文数量大增,可以想象,数字世界也是人的映射,必然带有某种价值取向。ChatGPT的快速迭代将把道德伦理与监管的问题推向台前,站在数据要素的角度就是如何用好数据、规范治理的问题,我们也将继续关注该领域的全球进展。 风险提示:AIGC发展不及预期,数据要素发展不及预期。 2023年02月12日 P.3 请仔细阅读本报告末页声明 免责声明 国盛证券有限责任公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 本报告的信息均来源于本公司认为可信的公开资料,但本公司及其研究人员对该等信息的准确性及完整性不作任何保证。本报告中的资料、意见及预测仅反映本公司于发布本报告当日的判断,可能会随时调整。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息及资料保持在最新状态,对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本公司力求报告内容客观、公正,但本报告所载的资料、工具、意见、信息及推测只提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,本公司不就报告中的内容对最终操作建议做出任何担保。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。 投资者应注意,在法律许可的情况下,本公司及其本公司的关联机构可能会持有本报告中涉及的公司所发行的证券并进行交易,也可能为这些公司正在提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。 本报告版权归“国盛证券有限责任公司”所有。未经事先本公司书面授权,任何机构或个人不得对本报告进行任何形式的发布、复制。任何机构或个人如引用、刊发本报告,需注明出处为“国盛证券研究所”,且不得对本报告进行有悖原意的删节或修改。 分析师声明 本报告署名分析师在此声明:我们具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,本报告所表述的任何观点均精准地反映了我们对标的证券和发行人的个人看法,结论不受任何第三方的授意或影响。我们所得报酬的任何部分无论是在过去、现在及将来均不会与本报告中的具体投资建议或观点有直接或间接联系。 投资评级说明 投资建议的评级标准 评级 说明 评级标准为报告发布日后的6个月内公司股价(或行业指数)相对同期基准指数的相对市场表现。其中A股市场以沪深300指数为基准;新三板市场以三板成指(针对协议转让标的)或三板做市指数(针对做市转让标的)为基准;香港市场以摩根士丹利中国指数为基准,美股市场以标普500指数或纳斯达克综合指数为基准。 股票评级 买入 相对同期基准指数涨幅在15%以上 增持 相对同期基准指数涨幅在5%~15%之间 持有 相对同期基准指数涨幅在-5%~+5%之间 减持 相对同期基准指数跌幅在5%以上 行业评级 增持 相对同期基准指数涨幅在10%以上 中性 相对同期基准指数涨幅在-10%~+10%之间 减持 相对同期基准指数跌幅在10%以上 国盛证券研究所 北京 上海 地址:北京市西城区平安里西大街26号楼3层 邮编:100032 传真:010-57671718 邮箱:gsresearch@gszq.com 地址:上海市浦明路868号保利One56 1号楼10层 邮编:200120 电话:021-38124100 邮箱:gsresearch@gszq.com 南昌 深圳 地址:南昌市红谷滩新区凤凰中大道1115号北京银行大厦 邮编:330038 传真:0791-86281485 邮箱:gsresearch@gszq.com 地址:深圳市福田区福华三路100号鼎和大厦24楼 邮编:518033 邮箱:gsresearch@gszq.com