本研究报告仅通过邮件提供给 中庚基金 使用。1 行业及产业 行业研究/行业点评 证券研究报告 计算机 2023年03月18日 一层是AIGC狂潮,深层是数字经济出海! 看好 ——计算机行业周报20230313-20130317 相关研究 "百度文心:一个符合预期的起点-AIGC系列之六" 2023年3月17日 "隐私计 算,数据 要素的 核心基础 设施-信息安全行业点评" 2023年3月16日 证券分析师 刘洋 A0230513050006 liuyang2@swsresearch.com 洪依真 A0230519060003 hongyz@swsresearch.com 黄忠煌 A0230519110001 huangzh@swsresearch.com 宁柯瑜 A0230520070005 ningky@swsresearch.com 施鑫展 A0230519080002 shixz@swsresearch.com 胡雪飞 A0230522120002 huxf@swsresearch.com 联系人 胡雪飞 (8621)23297818× huxf@swsresearch.com 本期投资提示: 本周周报包括四部分。1)首先,AIGC一系列重磅发布。GPT4+百度文心一言+微软Copilot等上周均重磅发布。我们本周发布AIGC系列5、系列6,分别详细评论多模态/百度AI/微软AI。2)在发展AIGC同时,我们既要注意到AIGC逐渐升高的成本,也要考虑到半导体/超算的潜在限制。3)综合考虑以上因素,“科技出海”是较好的应对方式。4)加推中控技术(tmt&机械)/虹软科技/润达医疗(医药)。 首先,本周是AIGC产品和系统的发布潮,我们发布AIGC报告5、报告6,分别论述跨模态/百度文心一言/微软Copilot。1)多模态。国内AI大模型相比美国落后较多。我们认为,实际上国内巨头已在跨模态有较多提前布局。市场认为,视觉大模型仍然需要更多参数标注、且transformer算法不适用于CV场景。我们认为,图像自动标注已经有了更多方法论,且trans应用于CV也开始成熟,算法和数据都已大幅迭代。2)百度文心一言。能够与人对话互动,回答问题,协助创作。文心一言展示出的水平符合我们预期:即从参数量、迭代路径看,国内NLP大模型水平介于BERT和GPT-3之间,与海外差距在2-3年。但同时,我们也看到现阶段ERNIE底座的一些不足:基于BERT、Prompt和RLHF已经掌握方法论,但实际训练量仍然有待提升、知识图谱训练、语料库。3)Copilot。AI驱动的Microsoft 365 Copilot,让Word、PPT、Excel、Outlook、协同办公软件的生产力倍增。办公软件和协同办公产品公司有望受益(金山办公、福昕软件、万兴科技等)。 其次,AIGC、大模型若蓬勃发展,应注意到成本与限制问题。 AIGC领域若蓬勃发展,会进入一轮“西方式”的发展赛道。这会弱化AI算法/算力成本的考量,而追求训练效果/性能/收入增速。AIGC的“鲶鱼效应”会导致较高甚至极高的算力需求,可能会加剧半导体/超算限制。 GPT-4虽然尚未官方披露硬件成本,但可以推测是GPT-3的500倍以上。 再次,应对上述的方式是“数字经济出海”,这是深层的计算机投资机会!1)上周数个AI发布会,部分投资者或许认为东西方技术存在差别(例如文心一言与GPT4的差别)。不必妄自菲薄,我们应考虑到经济主体的国家禀赋,例如我们“嵌入式软件“是世界领先的。应对“AIGC成本高+半导体超算可能限制”的办法,可能正是“科技出海”。若“数字经济”出海,会赋能世界重要产业链的重要环节,尤其上游环节,有话语权。即弥补AI技术差距的方式,并非直接追赶(要考虑国际禀赋),而是“弯道超车”甚至“围魏救赵”。 加推公司:中控技术(tmt&机械 )/虹软科技(视频适合大模型)/润达医疗(医药)。 数字经济领军:中控技术(tmt&机械,中东突破)、赛意信息、金山办公、启明星辰、英方软件、石基信息、AI领军、恒生电子、广联达、德赛西威。 信创弹性:太极股份、深信服、纳思达、深桑达、中国软件、海量数据、软通动力 AIGC&数据弹性: 虹软科技、AI领军、润达医疗(申万医药)、大华股份、上海钢联、广电运通、汉得信息、科大讯飞、深桑达、云赛智联、拓尔思。伴随AIGC发布会频频,近期360主线、运营商持股(启明星辰+大华股份)为重要主线。 风险:由于复工/宏观环境等扰动,2022-2023年内存在业绩波动风险 本研究报告仅通过邮件提供给 中庚基金 使用。2 行业点评 请务必仔细阅读正文之后的各项信息披露与声明 第2页 共23页 简单金融 成就梦想 本周周报包括四部分。 1)首先,AIGC一系列重磅发布。GPT4+百度 文心一 言+微软Copilot等上周 均重磅发布。我们本周发布AIGC系列5、系 列6,分别详 细评论多模态/百度AI/微软AI。 2)在发展AIGC同时,我们既要注意到AIGC逐渐升高的成本,也要考虑到半导体/超算的潜在限制。 3)综合考虑以上因素,“科技出海”是较好的应对方式。部分投 资者或 许认为 东西方技术存在 差别( 例如AIGC的文 心一言 与GPT4的 差别) 。不必 妄自菲 薄,我 们应该考虑到经济主体的国 家禀赋,例如 我们科 技中的“嵌入 式软件“是世 界领先 的。应对“AIGC成本高+半导体超算可能限制”的办法,可能正是“科技出海”。若“数字经济”出海,会赋能世界较多产业链的重要环节,尤其上游环节。即弥补AI技术差距的方式,往往并非直接追赶(要考虑国际禀赋),而是“弯道超车”甚至“围魏救赵”。例如近期福昕软件、万兴科技、中控技术、赛意信息、石基信息、通信运营商、部分互联网传媒公司,已较活 跃。 4)加推中控技术(tmt&机械)/虹软科技/润达医疗(医药)。 1、一方面,AIGC重磅发布:GPT4+百度文心一言+微软Copilot 本周是AIGC产品和系统的发布潮,我们分别论述跨模态/百度文心一言/微软Copilot。 去年ChatGPT惊艳亮 相后,O penAI在3月15日发布了GPT-4。我 们之前3月13日发布AIGC产业趋 势报告《跨模态:更多应用场景出现,中国公司得到更大机会-AIGC系列之五》。 百度文心 一言3月16日发布,我 们3月17日发 布《百度文心:一个符合预期的起点-AIGC系列之六》。 3月16日晚,微软发布由AI驱动 的Microsoft 365 Copilot。 表 1:AIGC系列多篇报告与AI大模型系列深度报告 序列 时间 标题 备注 AIGC系列一 2022年11月 《游戏政策面转暖,元宇宙AIGC催化》 游戏AIGC AIGC系列二 2023年1月 《微软投资 openAI一小步,AI与 chat GPT 一大步》 AI算法/商业原因 AIGC系列三 2023年2月 《ChatGPT/AIGC九问九答》 大模型/算法/场景等FAQ问题 AIGC系列四 2023年2月 《微软产品融合ChatGPT,全球巨头布局梳理》 微软和全球巨头 AIGC系列五 2023年3月 《跨模态:更多应用场景出现,中国公司得到更大机会》 大模型/跨模态 AIGC系列六 2023年3月 《百度文心:一个符合预期的起点》 百度文心 序列 时间 标题 备注 大模型深度 2022年12月 《大模型技术突破,AI多场景落地——2023 AI行业投资策略》 大模型技术突破 大模型深度 2021年12月 《领军路径分歧:更大的模型还是更低的成本?》 大模型深度 本研究报告仅通过邮件提供给 中庚基金 使用。3 行业点评 请务必仔细阅读正文之后的各项信息披露与声明 第3页 共23页 简单金融 成就梦想 资料来源:Wind,申万宏源研究 1.1 GPT4:跨模态等 3月13日发 布AIGC产业 趋势深 度报告《跨模态:更多应用场景出现,中国公司得到更大机会-AIGC系列之五》。 “模态 ”是指 数据的 存在 形式,比如文 本、 音频、 图像、 视频 等文件 格式 。多模 态是一种全 新 的交 互 、生 成 模式 , 集合 了 图像 、 语音 、 文本 等 方式 。我们 认 为, 多 模态/跨 模态AI大模型将得到相比ChatGPT等NLP大 模型更 大的应 用。 近期google、微软等海外巨头在2023年后在跨模态预训练大模型上有更大投入。3月google推出Palm-E参数量 达562B,可 以理解 图像, 还能理 解、生 成语言 ,并将 两者结合起来。微软推出多模态大型语言 模型, 此外计 划在下 周推 出GPT-4。 目前我们已经可以在跨模态中看到更多应用可能性。除 了已 经相 对成 熟的 文生 图外,人机互动、机器人控制、图片搜索,语音生 成等, 大量应 用涌 现。 本篇深度中,我们解释了大量市场预期差。 市场认为,国内AI大模型相比美国落后较多。我们认为,实际上国内巨头已在跨模态有较多提前布局。2022年 以前 ,百度 、华 为 、阿里 、腾 讯 、商汤 等公司 就已经 开始尝 试跨模态大模型应用。应用领域包括金融 、电商 、工业 、智慧 城市 等众多 领域。 市场认为,相比NLP单模态大模型,多模态技术难度在每个单点上都提升。我们认为,多模态可能反而降低了单点技术难度。类 似文 生图 等多 模态 大模 型对于 纯文 本特 征提 取要求降低,不 需要 理解长 文本,不 需要理 解多轮 对话;对文本 生成无 要求。DALL-E的参 数量从GPT-3的175B降低到12B就是一个 佐证。 市场认为,视觉大模型仍然需要更多参数标注、且transformer算法不适用于CV场景。我们认为,图像自动标注已经有了更多方法论,且trans应用于CV也开始成熟,算法和数据都已大幅迭代。更大 参数的 数据 模型意味 着更 多的 数据 标注。 我们 认为 更大 参数的数据模 型并不 直接意 味着更 多标注 数据需 求,但RLHF等需求 可能增 加。且 近年来 随着vit、swin transformer、mae等论 文推出 ,transformer在CV和跨模 态等应 用增加 。CV大模型参数量达到了百亿级别。 建议重点关注。视频、图像、文本素 材:大华股份、海天瑞声、AI领军、当虹科技; 算力和基础设施:中科曙光、拓维信息、寒武纪、浪潮信息、 光通信 和光模 块; 多模态 应用:1)文 生图:新国都、中科创达;2) 机器 人:三花智控、鸣志电器、绿的谐波;3)其 他应用:汤姆猫(申万传媒)、万兴科技、昆仑万维(申万传媒)、风语筑(申万传媒)。 视觉和跨模态算法:商汤(港股)、云从科技、虹软科技、科大讯飞 本研究报告仅通过邮件提供给 中庚基金 使用。4 行业点评 请务必仔细阅读正文之后的各项信息披露与声明 第4页 共23页 简单金融 成就梦想 风险提示:大模 型技 术中 美仍 存在 差异 ,部分 技术 尚处 于早 期实 验室 阶段 ,存 在落地风险;实体清单等可能对训练硬件产 生影响 。 1.2 百度发布:一个符合预期的起点 3月16日,百度正式发布了文心一言,能够与人对话互动,回答问题,协助创作。我们认为: 1)一些NLP人机对 话中基础的问 答、总结、 推理、创作 能力基 本具备; 2)部分特定场 景的中 文理解 可能超 过 了GPT;3)具备 了初步 的数理 逻辑 能力;4) 有特色 的多模态生成能力